官方文档
本文主要基于官方的文档,由于存在官方中文文档,故不再赘述内容 | > Beautiful Soup 4.4.0 文档
| | —- |
使用方法
soup = BeautifulSoup(open("index.html"), features = "lxml")
# 调用了 BeautifulSoup 的构造器,
# 传入了一个 html 文档,
# 并指定 lxml 为解析器,(如果不指定,那么就会自动采用最优的解析器)
# 创建了一个 soup 对象
最鲜明的特点是,bs4 处理后的对象以树的形式组织数据