使用python从字符串[duplicate]中删除HTML标记/格式

这个问题在这里已经有答案了
在Python中从字符串中剥离HTML

(27个答案)

四年前关闭的

我有一个包含html标记的字符串,如链接、粗体文本等

我想去掉所有的标签,这样我就有了原始文本

最好的方法是什么?正则表达式

如果要使用正则表达式:

重新导入
def striphtml(数据):
p=重新编译(r'<*?>'))
返回p.sub(“”,数据)
&燃气轮机&燃气轮机&燃气轮机;striphtml('<a href='https://stackoverflow.com/questions/3398852/foo.com“class=“bar”>我想要这个<b>文本!</b></a>”)
“我想要这个文本!”

发表评论