JS RegExp¶

约 1226 个字 1 行代码预计阅读时间 4 分钟

RegExp 对象¶

/pattern/modifier(s);

修饰符	描述
i	执行对大小写不敏感的匹配。
g	执行全局匹配（查找所有匹配而非在找到第一个匹配后停止）。
m	执行多行匹配。

括号元字符量词

元字符	描述
.	查找单个字符，除了换行符或行终止符。
\w	查找单词字符。
\W	查找非单词字符。
\d	查找数字。
\D	查找非数字字符。
\s	查找空白字符。
\S	查找非空白字符。
\b	在单词的开头/结尾查找匹配项，开头如下：\bHI，结尾如下：HI\b。
\B	查找匹配项，但不在单词的开头/结尾处。
\0	查找 NULL 字符。
\n	查找换行符。
\f	查找换页符。
\r	查找回车符。
\t	查找制表符。
\v	查找垂直制表符。
\xxx	查找以八进制数 xxx 规定的字符。
\xdd	查找以十六进制数 dd 规定的字符。
\uxxxx	查找以十六进制数 xxxx 规定的 Unicode 字符。

ha-ha,haa-haa
/(haa)/g
ha-ha,haa-haa

ha-ha,haa-haa
/(ha)-\1,(haa)-\2/g
ha-ha,haa-haa

可以对表达式进行分组，并使用(?:)确保它不被引用捕获。例如，下面有两个分组，但我们用 \1 引用的第一个组实际上是指向第二个组，因为第一个是未被捕获的分组。

ha-ha,haa-haa
/(?:ha)-ha,(haa)-\1/g
ha-ha,haa-haa

零宽断言(Lookarounds):如果我们希望正在写的词语出现在另一个词语之前或之后，我们需要使用「零宽断言」。
例如，我们要匹配文本中的小时值。为了只匹配后面有 PM 的数值，我们需要在表达式后面使用正向先行断言 (?=)，并在括号内的 = 后面添加 PM。

Data: 4 Aug 3PM
/\d+(?=PM)/g
Data: 4 Aug 3PM

例如，我们要在文本中匹配除小时值以外的数字。我们需要在表达式后面使用负向先行断言 (?!)，并在括号内的 ! 后面添加 PM，从而只匹配没有 PM 的数值。

Data: 4 Aug 3PM
/\d+(?!PM)/g
Data: 4 Aug 3PM

例如，我们要匹配文本中的金额数。为了只匹配前面带有 $ 的数字。我们要在表达式前面使用正向后行断言 (?<=)，并在括号内的 = 后面添加 \$。

Product Code: 1064 Price: $5
/(?<=\$)\d+/g
Product Code: 1064 Price: $5

例如，我们要在文本中匹配除价格外的数字。为了只匹配前面没有 $ 的数字，我们要在表达式前用负向后行断言 (?<!)，并在括号内的 ! 后面添加$`。

Product Code: 1064 Price: $5
/(?<!\$)\d+/g
Product Code: 1064 Price: $5

正则表达式默认执行贪婪匹配。这意味着匹配内容会尽可能长。如下面的示例，它匹配任何以 r 结尾的字符串，以及前面带有该字符串的文本，但它不会在第一个 r 处停止匹配。

ber beer beeer beeeer
/.*r/
ber beer beeer beeeer

与贪婪匹配不同，懒惰匹配在第一次匹配时停止。下面的例子中，在 * 之后添加 ?，将查找以 r 结尾且前面带有任意字符的第一个匹配项。这意味着本次匹配将会在第一个字母 r 处停止。

ber beer beeer beeeer
/.*?r/
ber beer beeer beeeer