知识点

正则匹配 网站 https://regex101.com/ ()是提取

元字符

  1. . 匹配除换行符以外的任意字符
  2. \w 匹配字母或数字或下划线或汉字
  3. \s 匹配任意的空白符
  4. \d 匹配数字
  5. \b 匹配单词的开始或结束
  6. ^ 匹配字符串的开始
  7. $ 匹配字符串的结束

字符转义

  1. . | * 等转义字符,必须得加 \\

重复

  1. *重复零次或更多次
  2. +重复一次或更多次
  3. ?重复零次或一次
  4. {n}重复n
  5. {n,}重复n次或更多次
  6. {n,m}重复nm

分组(以(\d{1,3}.){3}\d{1,3}为例)

  1. 要理解这个表达式,请按下列顺序分析它
  2. \d{1,3}匹配13位的数字
  3. (\d{1,3}\.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3
  4. 最后再加上一个一到三位的数字(\d{1,3})

常用

验证数字的正则表达式集
验证数字:[1]
验证至少n位数字:^\d{n,}
验证零和非零开头的数字:^(0|[1-9][0-9]
)
验证有1-3位小数的正实数:[2]+(.[0-9]{1,3})?
验证非零的负整数:^-[1-9][0-9]
验证非正整数(负整数 + 0) ^((-\d+)|(0+))
验证由26个英文字母组成的字符串:[3]+
验证由26个小写英文字母组成的字符串:[4]+
验证由数字、26个英文字母或者下划线组成的字符串:^\w+ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。
验证是否含有 ^%&’,;=?\x22]+
验证汉字:[5],{0,}
验证InternetURL:^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]_)?$[6]+://(w+(-w+))(.(w+(-w+)))_(?S
)?:—正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。
验证身份证号(15位或18位数字):^\d{15}|\d{}18 正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。
整数:^-?\d+
正浮点数 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))
负浮点数 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数 ^(-?\d+)(.\d+)?

ip

  1. >>> urls
  2. ['rtsp://admin:Admin123@192.168.1.201:554/cam/realmonitor?channel=1&subtype=0']
  3. >>> re.findall(r"\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b", urls[0])
  4. ['192.168.1.201']

正则表达式匹配ip地址
IP地址的长度为32位(共有2^32个IP地址),
分为4段,每段8位,用十进制数字表示,
每段数字范围为0~255,段与段之间用句点隔开
根据规则:每段相同,范围都在 0 ~ 255
0~255 对应的正则表达式为
2(5[0-5]{1}|[0-4]\d{1})|[0-1]?\d{1,2}

java的split()

  1. . | * 等转义字符,必须得加 \\
  2. 多个分隔符,可以用 | 作为连字符

  1. 0-9 ↩︎
  1. 0-9 ↩︎
  1. A-Za-z ↩︎
  1. a-z ↩︎
  1. \u4e00-\u9fa5 ↩︎
  1. a-zA-z ↩︎