去掉html文本的html标记 去掉html文本的html标记re.sub('<[^<]+?>|( )|(“)|(”)|(·)|(→)|(—)', '', text).replace('\n', '').strip()