从标记后的信息中提取所关注的内容

方法一:遍历

完整解析信息的标记形式,再提取关键信息

image.png

方法二:查找关键词

image.png

融合方法:结合形式解析与搜索方法,提取关键信息

  • 需要标记解析器及文本查找函数

    实例

    1. >>> from bs4 import BeautifulSoup
    2. >>> soup = BeautifulSoup(demp, 'html.parser')
    3. >>> for link in soup.find_all('a'):
    4. print(link.get('href'))
    5. http://www.icourse163.org/course/BIT-268001
    6. http://www.icourse163.org/course/BIT-1001870001