官方文档

  • 本文主要基于官方的文档,由于存在官方中文文档,故不再赘述内容 | > Beautiful Soup 4.4.0 文档

    | | —- |

使用方法

  1. soup = BeautifulSoup(open("index.html"), features = "lxml")
  2. # 调用了 BeautifulSoup 的构造器,
  3. # 传入了一个 html 文档,
  4. # 并指定 lxml 为解析器,(如果不指定,那么就会自动采用最优的解析器)
  5. # 创建了一个 soup 对象

最鲜明的特点是,bs4 处理后的对象以树的形式组织数据