則表達式(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE)使用單個字符串來描述、匹配一系列符合某個句法規則的字符串搜索模式。
搜索模式可用于文本搜索和文本替換。
什么是正則表達式?
正則表達式是由一個字符序列形成的搜索模式。
當你在文本中搜索數據時,你可以用搜索模式來描述你要查詢的內容。
正則表達式可以是一個簡單的字符,或一個更復雜的模式。
正則表達式可用于所有文本搜索和文本替換的操作。
語法
/正則表達式主體/修飾符(可選)
其中修飾符是可選的。
實例:
var patt = /runoob/i
實例解析:
/runoob/i 是一個正則表達式。
runoob 是一個正則表達式主體 (用于檢索)。
i 是一個修飾符 (搜索不區分大小寫)。
使用字符串方法
在 JavaScript 中,正則表達式通常用于兩個字符串方法 : search() 和 replace()。
search() 方法 用于檢索字符串中指定的子字符串,或檢索與正則表達式相匹配的子字符串,并返回子串的起始位置。
replace() 方法 用于在字符串中用一些字符替換另一些字符,或替換一個與正則表達式匹配的子串。
search() 方法使用正則表達式
實例
使用正則表達式搜索 "Runoob" 字符串,且不區分大小寫:
varstr = "Visit Runoob!"; varn = str.search(/Runoob/i);
輸出結果為:
6
search() 方法使用字符串
search 方法可使用字符串作為參數。字符串參數會轉換為正則表達式:
實例
檢索字符串中 "Runoob" 的子串:
varstr = "Visit Runoob!"; varn = str.search("Runoob");
replace() 方法使用正則表達式
實例
使用正則表達式且不區分大小寫將字符串中的 Microsoft 替換為 Runoob :
varstr = document.getElementById("demo").innerHTML; vartxt = str.replace(/microsoft/i,"Runoob");
結果輸出為:
Visit Runoob!
replace() 方法使用字符串
replace() 方法將接收字符串作為參數:
varstr = document.getElementById("demo").innerHTML; vartxt = str.replace("Microsoft","Runoob");
正則表達式修飾符
修飾符 可以在全局搜索中不區分大小寫:
正則表達式參數可用在以上方法中 (替代字符串參數)。
正則表達式使得搜索功能更加強大(如實例中不區分大小寫)。
修飾符 | 描述 |
---|---|
i | 執行對大小寫不敏感的匹配。 |
g | 執行全局匹配(查找所有匹配而非在找到第一個匹配后停止)。 |
m | 執行多行匹配。 |
正則表達式模式
方括號用于查找某個范圍內的字符:
表達式 | 描述 |
---|---|
[abc] | 查找方括號之間的任何字符。 |
[0-9] | 查找任何從 0 至 9 的數字。 |
(x|y) | 查找任何以 | 分隔的選項。 |
元字符是擁有特殊含義的字符:
元字符 | 描述 |
---|---|
\d | 查找數字。 |
\s | 查找空白字符。 |
\b | 匹配單詞邊界。 |
\uxxxx | 查找以十六進制數 xxxx 規定的 Unicode 字符。 |
量詞:
量詞 | 描述 |
---|---|
n+ | 匹配任何包含至少一個 n 的字符串。 |
n* | 匹配任何包含零個或多個 n 的字符串。 |
n? | 匹配任何包含零個或一個 n 的字符串。 |
使用 RegExp 對象
在 JavaScript 中,RegExp 對象是一個預定義了屬性和方法的正則表達式對象。
使用 test()
test() 方法是一個正則表達式方法。
test() 方法用于檢測一個字符串是否匹配某個模式,如果字符串中含有匹配的文本,則返回 true,否則返回 false。
以下實例用于搜索字符串中的字符 "e":
實例
var patt = /e/;
patt.test("The best things in life are free!");
字符串中含有 "e",所以該實例輸出為:
true
你可以不用設置正則表達式的變量,以上兩行代碼可以合并為一行:
/e/.test("The best things in life are free!")
使用 exec()
e
們來看看JavaScript中都有哪些操作正則的方法。
RegExp
RegExp 是正則表達式的構造函數。
使用構造函數創建正則表達式有多種寫法:
它接受兩個參數:第一個參數是匹配模式,可以是字符串也可以是正則表達式;第二個參數是修飾符。
如果第一個參數的正則表達式定義了修飾符,第二個參數又有值,則以第二個參數定義的修飾符為準,這是ES2015的新特性。
使用構造函數一般用于需要動態構造正則表達式的場景,性能不如字面量寫法。
我們來看看它的實例屬性:
match 是String實例方法。
它的作用是根據參數返回匹配結果,取名match也是非常恰當了。
它接受一個正則表達式作為唯一參數。
可是字符串也可以作為參數怎么解釋?
這是因為match方法內部會隱式的調用 new RegExp() 將其轉換成一個正則實例。
match方法的返回值可以分為三種情況。
沒什么可說的,返回 null 。
返回一個數組。
數組的第一項是匹配結果。如果不傳參則匹配結果為空字符串。
如果正則參數中有捕獲組,捕獲的結果在數組中從第二項開始依次排列。有捕獲組但是沒有捕獲內容則顯示 undefined 。
'@abc2018'.match(/@([a-z]+)([A-Z]+)?/); // ["@abc", "abc", undefined, index: 0, input: "@abc2018", groups: undefined]
數組有一個 index 屬性,標明匹配結果在文本中的起始位置。
數組有一個 input 屬性,顯示源文本。
數組有一個 groups 屬性,它存儲的不是捕獲組的信息,而是捕獲命名的信息。
'@abc2018'.match(/@(?<lowerCase>[a-z]+)(?<upperCase>[A-Z]+)?/); // ["@abc", "abc", undefined, index: 0, input: "@abc2018", groups: { lowerCase: "abc", upperCase: undefined }]
返回一個數組。
捕獲的若干結果在數組中依次排列。因為要返回所有匹配的結果,其他的信息,包括捕獲組和若干屬性就無法列出了。
replace 是String實例方法。
它的作用是將給定字符串替換匹配結果,并返回新的替換后的文本。源文本不會改變。
它接受兩個參數。
第一個參數可以是字符串或者正則表達式,它的作用是匹配。
參數是字符串和參數是正則表達式的區別在于:正則表達式的表達能力更強,而且可以全局匹配。因此參數是字符串的話只能進行一次替換。
第二個參數可以是字符串或者函數,它的作用是替換。
replace方法為第二個參數是字符串的方式提供了一些特殊的變量,能滿足一般需求。
$數字 代表相應順序的捕獲組。注意,雖然它是一個變量,但是不要寫成模板字符串`${}biu`,replace內部邏輯會自動解析字符串,提取出變量。
$& 代表匹配結果。
$`代表匹配結果左邊的文本。
$' 代表匹配結果右邊的文本。
有些時候我要的是變量的符號本身,而不是它的變量值,怎么辦?加一個 $ 轉義一下。
在不會造成誤會的場景,一個 $ 和兩個 $ 的效果都是一個 $ ,因為另一個充當轉義符號。會造成誤會的場景,那就必須加 $ 轉義了。
字符串的變量畢竟只能引用,無法操作。與之相對,函數的表達能力就強多了。
函數的返回值就是要替換的內容。函數如果沒有返回值,默認返回 undefined ,所以替換內容就是 undefined 。
函數的第一個參數,是匹配結果。
如果有捕獲組,函數的后順位參數與捕獲組一一對應。
'@abc3-xyz-$abc5'.replace(/([^-]+)abc(\d+)/g, (match, $1, $2) => `{${$1}${match}${$2}}`); // <a href="mailto:{@@abc33}-xyz-{$$abc55}">{@@abc33}-xyz-{$$abc55}</a>
倒數第二個參數是匹配結果在文本中的位置。
'@abc-xyz-$abc'.replace(/([^-]+)abc/g, (match, $1, index) => `{${match}是位置是${index}}`);
// <a href="mailto:{@abc是位置是0}-xyz-{$abc是位置是9}">{@abc是位置是0}-xyz-{$abc是位置是9}</a>
倒數第一個參數是源文本。
'abc-xyz'.replace(/abc/g, (match, index, string) => `{{${match}}屬于{${string}}}`); // "{{abc}屬于{abc-xyz}}-xyz"
replace方法最常用的地方是轉義HTML標簽。
'<p>hello regex</p>'.replace(/</g, '<').replace(/>/g, '>'); // "<p>hello regex</p>"
search 是String實例方法。
它的作用是找出首次匹配項的索引。它的功能較單一,性能也更好。
它接受一個正則表達式作為唯一參數。與match一樣,如果傳入一個非正則表達式,它會調用 new RegExp() 將其轉換成一個正則實例。
因為只能返回首次匹配的位置,所以全局匹配對它無效。
如果匹配失敗,返回 -1 。
split 是String實例方法。
它的作用是根據傳入的分隔符切割源文本。它返回一個由被切割單元組成的數組。
它接受兩個參數。第一個參數可以是字符串或者正則表達式,它是分隔符;第二個參數可選,限制返回數組的最大長度。
'abc-def_mno+xyz'.split(); // ["abc-def_mno+xyz"] 'abc-def_mno+xyz'.split('-_+'); // ["abc-def_mno+xyz"] 'abc-def_mno+xyz'.split(''); // ["a", "b", "c", "-", "d", "e", "f", "_", "m", "n", "o", "+", "x", "y", "z"] 'abc-def_mno+xyz'.split(/[-_+]/); // ["abc", "def", "mno", "xyz"] 'abc-def_mno+xyz'.split(/[-_+]/g); // ["abc", "def", "mno", "xyz"] 'abc-def_mno+xyz'.split(/[-_+]/, 3); // ["abc", "def", "mno"] 'abc-def_mno+xyz'.split(/[-_+]/, 5); // ["abc", "def", "mno", "xyz"]
如果第一個參數傳入的是空字符串,則會切割每一個字符串。
另外,因為split方法中的正則是用來匹配分隔符,所以全局匹配沒有意義。
exec 是RegExp實例方法。
它的作用是根據參數返回匹配結果,與字符串方法match相似。
小小的區別在于參數為空的情況:exec直接返回 null ;match返回一個空字符串數組。原因也很好理解,有魚沒有網,最壞也就是沒有收成;有網沒有魚,那可是連奔頭都沒有了。
它們倆最大的區別在于全局匹配的場景。
全局匹配就意味著多次匹配,RegExp實例有一個 lastIndex 屬性,每匹配一次,這個屬性就會更新為下一次匹配開始的位置。exec就是根據這個屬性來實現全局匹配的。
如果有多個匹配結果,多次執行就能獲得所有的匹配結果。所以exec一般用在循環語句中。
有兩點需要特別注意:
因為 lastIndex 會不斷更新,最終又會歸于0,所以這個匹配過程是可以無限重復的。
lastIndex 屬性是屬于正則實例的。只有同一個實例的 lastIndex 才會不斷更新。
知道第二點意味著什么嗎?
如果不把正則提取出來,獲得它的引用,exec方法就一直在原地打轉,因為每次都是一個新的正則實例,每次 lastIndex 都要從0開始。
test 是RegExp實例方法。
它的作用是找出源文本是否有匹配項,與字符串方法search相似。多用于表單驗證中。
test方法與search方法的區別主要體現在兩點:
修改字符串方法的底層實現
我們也看到了,一部分處理正則的方法定義在String實例上,一部分處理正則的方法定義在RegExp實例上。為了將處理正則的方法全部統一到RegExp實例上,ES2015修改了部分字符串方法的底層實現。
具體來說,ES2015為RegExp實例新增了四個方法,字符串方法 match 、 replace 、 search 、 split 內部調用已經改成了相應的RegExp實例方法。
Symbol.match 是什么? Symbol 是新增的一種基礎數據類型,它有11個內置的值,指向語言內部使用的方法。
RegExp.prototype[Symbol.match] 在使用上和 match 相比,調用者和參數翻轉一下就可以了。
以上所述是小編給大家介紹的一篇文章搞懂JavaScript正則表達式之方法的相關知識,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。后面小編會分享更多運維方面的干貨,感興趣的朋友走一波關注哩~
正則表達式是一種用來匹配字符串的強有力的武器
它的設計思想是用一種描述性的語言定義一個規則,凡是符合規則的字符串,我們就認為它“匹配”了,否則,該字符串就是不合法的
根據正則表達式語法規則,大部分字符僅能夠描述自身,這些字符被稱為普通字符,如所有的字母、數字等。
元字符就是擁有特動功能的特殊字符,大部分需要加反斜杠進行標識,以便于普通字符進行區別,而少數元字符,需要加反斜杠,以便轉譯為普通字符使用。JavaScript 正則表達式支持的元字符如表所示。
在 JavaScript中,正則表達式也是對象,構建正則表達式有兩種方式:
const re = /\d+/g;
const re = new RegExp("\\d+","g");
const rul = "\\d+"
const re1 = new RegExp(rul,"g");
使用構建函數創建,第一個參數可以是一個變量,遇到特殊字符\需要使用\進行轉義
表示字符的方法有多種,除了可以直接使用字符本身外,還可以使用 ASCII 編碼或者 Unicode 編碼來表示。
下面使用 ASCII 編碼定義正則表達式直接量。
var r = /\x61/;var s = "JavaScript";var a = s.match(s);
由于字母 a 的 ASCII 編碼為 97,被轉換為十六進制數值后為 61,因此如果要匹配字符 a,就應該在前面添加“\x”前綴,以提示它為 ASCII 編碼。
除了十六進制外,還可以直接使用八進制數值表示字符。
var r = /1/;var s = "JavaScript";var a = s.match(r);
使用十六進制需要添加“\x”前綴,主要是為了避免語義混淆,而八進制則不需要添加前綴。
ASCII 編碼只能夠匹配有限的單字節字符,使用 Unicode 編碼可以表示雙字節字符。Unicode 編碼方式:“\u”前綴加上 4 位十六進制值。
var r = "/\u0061/";var s = "JavaScript";var a = s.match(s);
在 RegExp() 構造函數中使用元字符時,應使用雙斜杠。
var r = new RegExp("\u0061");
RegExp() 構造函數的參數只接受字符串,而不是字符模式。在字符串中,任何字符加反斜杠還表示字符本身,如字符串“\u”就被解釋為 u 本身,所以對于“\u0061”字符串來說,在轉換為字符模式時,就被解釋為“u0061”,而不是“\u0061”,此時反斜杠就失去轉義功能。解決方法:在字符 u 前面加雙反斜杠。
常見的校驗規則如下:
規則 | 描述 |
\ | 轉義 |
^ | 匹配輸入的開始 |
$ | 匹配輸入的結束 |
* | 匹配前一個表達式 0 次或多次 |
+ | 匹配前面一個表達式 1 次或者多次。等價于 {1,} |
? | 匹配前面一個表達式 0 次或者 1 次。等價于{0,1} |
. | 默認匹配除換行符之外的任何單個字符 |
x(?=y) | 匹配'x'僅僅當'x'后面跟著'y'。這種叫做先行斷言 |
(?<=y)x | 匹配'x'僅當'x'前面是'y'.這種叫做后行斷言 |
x(?!y) | 僅僅當'x'后面不跟著'y'時匹配'x',這被稱為正向否定查找 |
(?<!y)x | 僅僅當'x'前面不是'y'時匹配'x',這被稱為反向否定查找 |
x|y | 匹配‘x’或者‘y’ |
{n} | n 是一個正整數,匹配了前面一個字符剛好出現了 n 次 |
{n,} | n是一個正整數,匹配前一個字符至少出現了n次 |
{n,m} | n 和 m 都是整數。匹配前面的字符至少n次,最多m次 |
[xyz] | 一個字符集合。匹配方括號中的任意字符 |
[^xyz] | 匹配任何沒有包含在方括號中的字符 |
\b | 匹配一個詞的邊界,例如在字母和空格之間 |
\B | 匹配一個非單詞邊界 |
\d | 匹配一個數字 |
\D | 匹配一個非數字字符 |
\f | 匹配一個換頁符 |
\n | 匹配一個換行符 |
\r | 匹配一個回車符 |
\s | 匹配一個空白字符,包括空格、制表符、換頁符和換行符 |
\S | 匹配一個非空白字符 |
\w | 匹配一個單字字符(字母、數字或者下劃線) |
\W | 匹配一個非單字字符 |
標志 | 描述 |
g | 全局搜索。 |
i | 不區分大小寫搜索。 |
m | 多行搜索。 |
s | 允許 . 匹配換行符。 |
u | 使用unicode碼的模式進行匹配。 |
y | 執行“粘性(sticky)”搜索,匹配從目標字符串的當前位置開始。 |
使用方法如下:
var re = /pattern/flags;
var re = new RegExp("pattern", "flags");
在了解下正則表達式基本的之外,還可以掌握幾個正則表達式的特性:
在了解貪婪模式前,首先舉個例子:
const reg = /ab{1,3}c/
在匹配過程中,嘗試可能的順序是從多往少的方向去嘗試。首先會嘗試bbb,然后再看整個正則是否能匹配。不能匹配時,吐出一個b,即在bb的基礎上,再繼續嘗試,以此重復
如果多個貪婪量詞挨著,則深度優先搜索
const string = "12345";
const regx = /(\d{1,3})(\d{1,3})/;
console.log( string.match(reg) );
// => ["12345", "123", "45", index: 0, input: "12345"]
其中,前面的\d{1,3}匹配的是"123",后面的\d{1,3}匹配的是"45"
惰性量詞就是在貪婪量詞后面加個問號。表示盡可能少的匹配
var string = "12345";
var regex = /(\d{1,3}?)(\d{1,3})/;
console.log( string.match(regex) );
// => ["1234", "1", "234", index: 0, input: "12345"]
其中\d{1,3}?只匹配到一個字符"1",而后面的\d{1,3}匹配了"234"
分組主要是用過()進行實現,比如beyond{3},是匹配d字母3次。而(beyond){3}是匹配beyond三次
在()內使用|達到或的效果,如(abc | xxx)可以匹配abc或者xxx
反向引用,巧用$分組捕獲
let str = "John Smith";
// 交換名字和姓氏
console.log(str.replace(/(john) (smith)/i, '$2, $1')) // Smith, John
正則表達式常被用于某些方法,我們可以分成兩類:
方法 | 描述 |
exec | 一個在字符串中執行查找匹配的RegExp方法,它返回一個數組(未匹配到則返回 null)。 |
test | 一個在字符串中測試是否匹配的RegExp方法,它返回 true 或 false。 |
match | 一個在字符串中執行查找匹配的String方法,它返回一個數組,在未匹配到時會返回 null。 |
matchAll | 一個在字符串中執行查找所有匹配的String方法,它返回一個迭代器(iterator)。 |
search | 一個在字符串中測試匹配的String方法,它返回匹配到的位置索引,或者在失敗時返回-1。 |
replace | 一個在字符串中執行查找匹配的String方法,并且使用替換字符串替換掉匹配到的子字符串。 |
split | 一個使用正則表達式或者一個固定字符串分隔一個字符串,并將分隔后的子字符串存儲到數組中的 String 方法。 |
str.match(regexp) 方法在字符串 str 中找到匹配 regexp 的字符
如果 regexp 不帶有 g 標記,則它以數組的形式返回第一個匹配項,其中包含分組和屬性 index(匹配項的位置)、input(輸入字符串,等于 str)
let str = "I love JavaScript";
let result = str.match(/Java(Script)/);
console.log( result[0] ); // JavaScript(完全匹配)
console.log( result[1] ); // Script(第一個分組)
console.log( result.length ); // 2
// 其他信息:
console.log( result.index ); // 7(匹配位置)
console.log( result.input ); // I love JavaScript(源字符串)
如果 regexp 帶有 g 標記,則它將所有匹配項的數組作為字符串返回,而不包含分組和其他詳細信息
let str = "I love JavaScript";
let result = str.match(/Java(Script)/g);
console.log( result[0] ); // JavaScript
console.log( result.length ); // 1
如果沒有匹配項,則無論是否帶有標記 g ,都將返回 null
let str = "I love JavaScript";
let result = str.match(/HTML/);
console.log(result); // null
返回一個包含所有匹配正則表達式的結果及分組捕獲組的迭代器
const regexp = /t(e)(st(\d?))/g;
const str = 'test1test2';
const array = [...str.matchAll(regexp)];
console.log(array[0]);
// expected output: Array ["test1", "e", "st1", "1"]
console.log(array[1]);
// expected output: Array ["test2", "e", "st2", "2"]
返回第一個匹配項的位置,如果未找到,則返回 -1
let str = "A drop of ink may make a million think";
console.log( str.search( /ink/i ) ); // 10(第一個匹配位置)
這里需要注意的是,search 僅查找第一個匹配項
替換與正則表達式匹配的子串,并返回替換后的字符串。在不設置全局匹配g的時候,只替換第一個匹配成功的字符串片段
const reg1=/javascript/i;
const reg2=/javascript/ig;
console.log('hello Javascript Javascript Javascript'.replace(reg1,'js'));
//hello js Javascript Javascript
console.log('hello Javascript Javascript Javascript'.replace(reg2,'js'));
//hello js js js
使用正則表達式(或子字符串)作為分隔符來分割字符串
console.log('12, 34, 56'.split(/,\s*/)) // 數組 ['12', '34', '56']
regexp.exec(str) 方法返回字符串 str 中的 regexp 匹配項,與以前的方法不同,它是在正則表達式而不是字符串上調用的
根據正則表達式是否帶有標志 g,它的行為有所不同
如果沒有 g,那么 regexp.exec(str) 返回的第一個匹配與 str.match(regexp) 完全相同
如果有標記 g,調用 regexp.exec(str) 會返回第一個匹配項,并將緊隨其后的位置保存在屬性regexp.lastIndex 中。 下一次同樣的調用會從位置 regexp.lastIndex 開始搜索,返回下一個匹配項,并將其后的位置保存在 regexp.lastIndex 中
let str = 'More about JavaScript at https://javascript.info';
let regexp = /javascript/ig;
let result;
while (result = regexp.exec(str)) {
console.log( `Found ${result[0]} at position ${result.index}` );
// Found JavaScript at position 11
// Found javascript at position 33
}
查找匹配項,然后返回 true/false 表示是否存在
let str = "I love JavaScript";
// 這兩個測試相同
console.log( /love/i.test(str) ); // true
通過上面的學習,我們對正則表達式有了一定的了解
下面再來看看正則表達式一些案例場景:
驗證QQ合法性(5~15位、全是數字、不以0開頭):
const reg = /^[1-9][0-9]{4,14}$/
const isvalid = patrn.exec(s)
校驗用戶賬號合法性(只能輸入5-20個以字母開頭、可帶數字、“_”、“.”的字串):
var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/;
const isvalid = patrn.exec(s)
將url參數解析為對象
const protocol = '(?<protocol>https?:)';
const host = '(?<host>(?<hostname>[^/#?:]+)(?::(?<port>\\d+))?)';
const path = '(?<pathname>(?:\\/[^/#?]+)*\\/?)';
const search = '(?<search>(?:\\?[^#]*)?)';
const hash = '(?<hash>(?:#.*)?)';
const reg = new RegExp(`^${protocol}\/\/${host}${path}${search}${hash}$`);
function execURL(url){
const result = reg.exec(url);
if(result){
result.groups.port = result.groups.port || '';
return result.groups;
}
return {
protocol:'',host:'',hostname:'',port:'',
pathname:'',search:'',hash:'',
};
}
console.log(execURL('https://localhost:8080/?a=b#xxxx'));
protocol: "https:"
host: "localhost:8080"
hostname: "localhost"
port: "8080"
pathname: "/"
search: "?a=b"
hash: "#xxxx"
再將上面的search和hash進行解析
function execUrlParams(str){
str = str.replace(/^[#?&]/,'');
const result = {};
if(!str){ //如果正則可能配到空字符串,極有可能造成死循環,判斷很重要
return result;
}
const reg = /(?:^|&)([^&=]*)=?([^&]*?)(?=&|$)/y
let exec = reg.exec(str);
while(exec){
result[exec[1]] = exec[2];
exec = reg.exec(str);
}
return result;
}
console.log(execUrlParams('#'));// {}
console.log(execUrlParams('##'));//{'#':''}
console.log(execUrlParams('?q=3606&src=srp')); //{q: "3606", src: "srp"}
console.log(execUrlParams('test=a=b=c&&==&a='));//{test: "a=b=c", "": "=", a: ""}
1. dotAll模式(s選項)
這個特性已經在ECMAScript 2018正式發布了。
默認情況下,.可以匹配任意字符,除了換行符:
/foo.bar/u.test('foo\nbar'); // false
另外,.不能匹配Unicode字符,需要使用u選項啟用Unicode模式才行。
ES2018引入了dotAll模式,通過s選項可以啟用,這樣,.就可以匹配換行符了。
/foo.bar/su.test('foo\nbar'); // true
2. Lookbehind斷言
這個特性已經在ECMAScript 2018正式發布了。
ECMAScript目前僅支持lookahead斷言。
下面示例是Positive lookahead,匹配字符串“42 dollars”中緊跟著是”dollars”的數字:
const pattern = /\d+(?= dollars)/u;
const result = pattern.exec('42 dollars');
console.log(result[0]); // 打印42
下面示例是Negative lookahead,匹配字符串“42 pesos”中緊跟著的不是”dollars”的數字:
const pattern = /\d+(?! dollars)/u;
const result = pattern.exec('42 pesos');
console.log(result[0]); // 打印42
ES2018添加了lookbehind斷言。
下面示例是Positive lookbehind,匹配字符串“”中前面是”$”的數字:
const pattern = /(?<=\$)\d+/u;
const result = pattern.exec('$42');
console.log(result[0]); // 打印42
下面示例是Negative lookbehind,匹配字符串“”中前面不是是”$”的數字:
const pattern = /(?<!\$)\d+/u;
const result = pattern.exec('€42');
console.log(result[0]); // 打印42
Fundebug專注于網頁、微信小程序、微信小游戲,支付寶小程序,React Native,Node.js和Java線上BUG實時監控,歡迎免費試用
3. Named capture groups
這個特性已經在ECMAScript 2018正式發布了。
目前,正則表達式中小括號匹配的分組是通過數字編號的:
const pattern = /(\d{4})-(\d{2})-(\d{2})/u;
const result = pattern.exec('2017-01-25');
console.log(result[0]); // 打印"2017-01-25"
console.log(result[1]); // 打印"2017"
console.log(result[2]); // 打印"01"
console.log(result[3]); // 打印"25"
這樣很方便,但是可讀性很差,且不易維護。一旦正則表達式中小括號的順序有變化時,我們就需要更新對應的數字編號。
ES2018添加named capture groups, 可以指定小括號中匹配內容的名稱,這樣可以提高代碼的可讀性,也便于維護。
const pattern = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u;
const result = pattern.exec('2017-01-25');
console.log(result.groups.year); // 打印"2017"
console.log(result.groups.month); // 打印"01"
console.log(result.groups.day); // 打印"25"
4. Unicode property escapes
這個特性已經在ECMAScript 2018正式發布了。
Unicode標準為每一個字符分配了多個屬性。比如,當你要匹配希臘語字符時,則可以搜索Script_Extensions屬性為Greek的字符。
Unicode property escapes使得我們可以使用ECMAScript正則表達式直接匹配Unicode字符的屬性:
const regexGreekSymbol = /\p{Script_Extensions=Greek}/u;
console.log(regexGreekSymbol.test('π')); // 打印true
5. String.prototype.matchAll
這個特性還處在Stage 3 Draft
g和y選項通常用于匹配一個字符串,然后遍歷所有匹配的子串,包括小括號匹配的分組。String.prototype.matchAll讓這個操作變得更加簡單了。
const string = 'Magic hex numbers: DEADBEEF CAFE 8BADF00D';
const regex = /\b[0-9a-fA-F]+\b/g;
for (const match of string.matchAll(regex)) {
console.log(match);
}
每一個迭代所返回的match對象與regex.exec(string)所返回的結果相同:
// Iteration 1:
[
'DEADBEEF',
index: 19,
input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'
]
// Iteration 2:
[
'CAFE',
index: 28,
input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'
]
// Iteration 3:
[
'8BADF00D',
index: 33,
input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'
]
注意,這個特性還處在Stage 3 Draft,因此還存在變化的可能性,示例代碼是根據最新的提案寫的。另外,瀏覽器也還沒有支持這個特性。String.prototype.matchAll最快可以被加入到ECMAScript 2019中。
6. 規范RegExp遺留特性
這個提案還處在Stage 3 Draft
這個提案規范了RegExp的遺留特性,比如RegExp.prototype.compile方法以及它的靜態屬性從RegExp.到RegExp.。雖然這些特性已經棄用(deprecated)了,但是為了兼容性我們不能將他們去。因此,規范這些RegExp遺留特性是最好的方法。因此,這個提案有助于保證兼容性。
/**
* @param {string} path
* @returns {Boolean}
*/
export function isExternal(path) {
return /^(https?:|mailto:|tel:)/.test(path)
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validUsername(str) {
const valid_map = ['admin', 'editor']
return valid_map.indexOf(str.trim()) >= 0
}
/**
* @param {string} url
* @returns {Boolean}
*/
export function validURL(url) {
const reg = /^(https?|ftp):\/\/([a-zA-Z0-9.-]+(:[a-zA-Z0-9.&%$-]+)*@)*((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9][0-9]?)(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|([a-zA-Z0-9-]+\.)*[a-zA-Z0-9-]+\.(com|edu|gov|int|mil|net|org|biz|arpa|info|name|pro|aero|coop|museum|[a-zA-Z]{2}))(:[0-9]+)*(\/($|[a-zA-Z0-9.,?'\\+&%$#=~_-]+))*$/
return reg.test(url)
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validLowerCase(str) {
const reg = /^[a-z]+$/
return reg.test(str)
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validUpperCase(str) {
const reg = /^[A-Z]+$/
return reg.test(str)
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validAlphabets(str) {
const reg = /^[A-Za-z]+$/
return reg.test(str)
}
/**
* @param {string} email
* @returns {Boolean}
*/
export function validEmail(email) {
const reg = /^(([^<>()\[\]\\.,;:\s@"]+(\.[^<>()\[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/
return reg.test(email)
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function isString(str) {
if (typeof str === 'string' || str instanceof String) {
return true
}
return false
}
/**
* @param {Array} arg
* @returns {Boolean}
*/
export function isArray(arg) {
if (typeof Array.isArray === 'undefined') {
return Object.prototype.toString.call(arg) === '[object Array]'
}
return Array.isArray(arg)
}
TS版
/**
* @param {string} path
* @returns {Boolean}
*/
export function isExternal(path) {
return /^(https?:|mailto:|tel:)/.test(path);
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validUsername(str) {
const valid_map = ['admin', 'editor'];
return valid_map.indexOf(str.trim()) >= 0;
}
/**
* @param {string} url
* @returns {Boolean}
*/
export function validURL(url) {
const reg =
/^(https?|ftp):\/\/([a-zA-Z0-9.-]+(:[a-zA-Z0-9.&%$-]+)*@)*((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9][0-9]?)(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}|([a-zA-Z0-9-]+\.)*[a-zA-Z0-9-]+\.(com|edu|gov|int|mil|net|org|biz|arpa|info|name|pro|aero|coop|museum|[a-zA-Z]{2}))(:[0-9]+)*(\/($|[a-zA-Z0-9.,?'\\+&%$#=~_-]+))*$/;
return reg.test(url);
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validLowerCase(str) {
const reg = /^[a-z]+$/;
return reg.test(str);
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validUpperCase(str) {
const reg = /^[A-Z]+$/;
return reg.test(str);
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function validAlphabets(str) {
const reg = /^[A-Za-z]+$/;
return reg.test(str);
}
/**
* @param {string} email
* @returns {Boolean}
*/
export function validEmail(email) {
const reg =
/^(([^<>()\[\]\\.,;:\s@"]+(\.[^<>()\[\]\\.,;:\s@"]+)*)|(".+"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/;
return reg.test(email);
}
/**
* @param {string} phone
* @returns {Boolean}
*/
export function validPhone(phone) {
const reg = /^1[3-9][0-9]{9}$/;
return reg.test(phone);
}
/**
* @param {string} str
* @returns {Boolean}
*/
export function isString(str) {
if (typeof str === 'string' || str instanceof String) {
return true;
}
return false;
}
/**
* @param {Array} arg
* @returns {Boolean}
*/
export function isArray(arg) {
if (typeof Array.isArray === 'undefined') {
return Object.prototype.toString.call(arg) === '[object Array]';
}
return Array.isArray(arg);
}
// [修改]-新增-開始
/**
* 英文驗證
* @param min
* @param max
* @param value
*/
export function english(value: string, min = 6, max = 12): boolean {
return new RegExp('^[a-z|A-Z]{' + min + ',' + max + '}$').test(value);
}
/**
* 中文驗證
* @param min
* @param max
* @param value
*/
export function chinese(value: string, min = 2, max = 12): boolean {
return new RegExp('^[\u4e00-\u9fa5]{' + min + ',' + max + '}$').test(value);
}
/**
* 非中文
* @param value 內容
* @returns boolean
*/
export function notChinese(value: string): boolean {
return !/[\u4e00-\u9fa5]/.test(value);
}
/**
* 必需數字
* @param min
* @param max
* @param value
*/
export function number(value: string, min = 1, max = 20): boolean {
return new RegExp('^d{' + min + ',' + max + '}$').test(value);
}
/**
* 必需小數點最大值
* @param min
* @param max
* @param value
*/
export function precision(value: string, max = 8, precision = 8): boolean {
return new RegExp(
'(^[0-9]{1,' + max + '}$)|(^[0-9]{1,' + max + '}[.]{1}[0-9]{1,' + precision + '}$)',
).test(value);
}
/**
* 復雜密碼驗證
* @param value
*/
export function pwd(value: string): boolean {
if (value && value.length > 15) {
const en = /[a-z]/.test(value);
const num = /[0-9]/.test(value);
const daxie = /[A-Z]/.test(value);
const teshu = /[~!@#$%^&*()_+=-\[\]\\,.\/;':{}]/.test(value);
return en && num && daxie && teshu;
}
return false;
}
// [修改]-新增-結束
給大家分享我收集整理的各種學習資料,前端小白交學習流程,入門教程等回答-下面是學習資料參考。
前端學習交流、自學、學習資料等推薦 - 知乎
*請認真填寫需求信息,我們會在24小時內與您取得聯系。