?的使用

used? 表示d可有或没有

*的使用

ab*c 表示b可有1个或者多个或者没有 不会匹配adc

+的使用

ab+c 表示匹配出现一个或者多个b的情况
ab{6}c 表示匹配出现6次b的内容
ab{2,6}c 表示匹配出现2~6次b的内容

或运算符

a (cat|dog)表示匹配 a cat 或者a dog
括号不可以去掉,否则或变成匹配 a cat 或者 dog

正则表达式

[a-zA-Z0-9]+ 表示匹配包含有a-z且包含有A-Z且包含有0-9范围内的内容,三个范围内的值必须包括
[^0-9]+ 表示匹配数字外的内容

元字符

数字字符:\d+ 等同于[0-9]
单词字符:\w 表示英文、数字及下划线
空白符:\s 包含Tab与换行符

非数字字符:\d+
非单词字符:\w
非空白符:\s

.*代表任意字符,但不包含换行符
^匹配行首 例如^a会匹配abc
$匹配行尾 例如$a会匹配abca

贪婪与懒惰匹配

<.+>会将下面所有的内容匹配,<.+?>会匹配
This is a sample text