这个问题在这里已经有答案了:
在Python中从字符串中剥离HTML
(27个答案)
(27个答案)
四年前关闭的
我有一个包含html标记的字符串,如链接、粗体文本等
我想去掉所有的标签,这样我就有了原始文本
最好的方法是什么?正则表达式
如果要使用正则表达式:
重新导入
def striphtml(数据):
p=重新编译(r'<;*?>;'))
返回p.sub(“”,数据)
&燃气轮机&燃气轮机&燃气轮机;striphtml('<;a href='https://stackoverflow.com/questions/3398852/foo.com“class=“bar”>;我想要这个<;b>;文本!<;/b>;<;/a>;”)
“我想要这个文本!”