w3lib.html.remove_tags

安装第三方包

  1. pip install w3lib

使用

  1. from w3lib.html import remove_tags
  2. s = '<h1><p>hello <i>world</i></p></h1>'
  3. print(remove_tags(s))
  4. # hello world
  5. print(remove_tags(s, which_ones=('p','i'))) # 指定要移除的tags
  6. # <h1>hello world</h1>
  7. print(remove_tags(s, keep=('p','i'))) # 指定要保留的tags
  8. # <p>hello <i>world</i></p>