表1.常用的元字符代码 说明
. 匹配除换行符以外的任意字符
表示前边的内容可以连续重复使用任意次以使整个表达式得到匹配
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
举例:
(1)\bhi\b.\bLucy\b
含义:先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词结尾。
(2)0\d\d-\d\d\d\d\d\d\d\d
含义:以0开头,然后是两个数字,然后是一个连字号“-”,最后是8个数字
(3)0\d{2}-\d{8}
含义:这里\d后面的{2}({8})的意思是前面\d必须连续重复匹配2次(8次)。
(4)\ba\w\b
含义:匹配以字母a开头的单词——先是某个单词开始处(\b),然后是字母a,然后是任意数量的字母或数字(\w),最后是单词结束处(\b)。
(5)\b\w{6}\b
含义:匹配刚好6个字符的单词。
(6)^\d{5,12}$。 含义:{5,12}则是重复的次数不能少于5次,不能多于12次,否则都不匹配。^和$的意义就变成了匹配行的开始处和结束处。
表2.常用的限定符
代码/语法 说明
重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
表3.常用的反义代码
代码/语法 说明
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
举例:
(1)(?0\d{2}[) -]?\d{8}。
注释:这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。我们对它进行一些分析吧:
首先是一个转义字符(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\d{2}),
然后是)或-或空格中的一个,它出现1次或不出现(?),最后是8个数字(\d{8})。
含义:转义了( 后面出现了会出现一个),如果没有就出现 — 连字符,对应上面的几种电话格式
表4.懒惰限定符
代码/语法 说明
? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
