知识点
正则匹配 网站 https://regex101.com/ ()是提取
元字符
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
字符转义
. 、 | 和 * 等转义字符,必须得加 \\
重复
*重复零次或更多次
+重复一次或更多次
?重复零次或一次
{n}重复n次
{n,}重复n次或更多次
{n,m}重复n到m次
分组(以(\d{1,3}.){3}\d{1,3}为例)
要理解这个表达式,请按下列顺序分析它
\d{1,3}匹配1到3位的数字
(\d{1,3}\.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次
最后再加上一个一到三位的数字(\d{1,3})
常用
验证数字的正则表达式集
验证数字:[1]
验证至少n位数字:^\d{n,}
验证零和非零开头的数字:^(0|[1-9][0-9])
验证有1-3位小数的正实数:[2]+(.[0-9]{1,3})?
验证非零的负整数:^-[1-9][0-9]
验证非正整数(负整数 + 0) ^((-\d+)|(0+))
验证由26个英文字母组成的字符串:[3]+
验证由26个小写英文字母组成的字符串:[4]+
验证由数字、26个英文字母或者下划线组成的字符串:^\w+ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。
验证是否含有 ^%&’,;=?\x22]+
验证汉字:[5],{0,}
验证InternetURL:^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]_)?$ ;[6]+://(w+(-w+))(.(w+(-w+)))_(?S)?:—正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。
验证身份证号(15位或18位数字):^\d{15}|\d{}18 正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。
整数:^-?\d+
正浮点数 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))
负浮点数 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数 ^(-?\d+)(.\d+)?
ip
>>> urls
['rtsp://admin:Admin123@192.168.1.201:554/cam/realmonitor?channel=1&subtype=0']
>>> re.findall(r"\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b", urls[0])
['192.168.1.201']
正则表达式匹配ip地址
IP地址的长度为32位(共有2^32个IP地址),
分为4段,每段8位,用十进制数字表示,
每段数字范围为0~255,段与段之间用句点隔开
根据规则:每段相同,范围都在 0 ~ 255
0~255 对应的正则表达式为
2(5[0-5]{1}|[0-4]\d{1})|[0-1]?\d{1,2}
java的split()
. 、 | 和 * 等转义字符,必须得加 \\
多个分隔符,可以用 | 作为连字符
- 0-9 ↩︎
- 0-9 ↩︎
- A-Za-z ↩︎
- a-z ↩︎
- \u4e00-\u9fa5 ↩︎
- a-zA-z ↩︎