re模块用来匹配正则表达式,通常在爬虫中有着重要的作用,这里简单介绍最常见的方法。

方法及样例

  1. re.findall() 查找所有符合的字符串,返回list
  2. re.search() 查找第一个符合的字符串,返回string。如果匹配不到则返回None。
  3. re.match() 只能从字符串的开头进行匹配
  4. re.finditer() 和findall差不多,但是这里是迭代器
  5. re.compile() 将长长的正则进行预加载,方便后面的使用
  6. 正则中的内容如何单独提取?

image.png
image.png

参考链接