python去除html标签的方法有什么？你知道多少？-群英

python去除html标签的方法有什么？你知道多少？

PHP中文网发表于 2021-09-26 18:06 次浏览

python去除html标签的方法有什么？在Python中，我们想要去除html标签有很多方法，例如使用pattern.sub('',html)方法、BeautifulSoup(html,'html.parser')方法或者response.xpath('string(.)')方法，那么具体怎样做呢？下面我们一起来看看。

本文操作环境：windows7系统、python3.6.4版，DELL G3电脑。

python去除html标签的几种方法

import re
from bs4 import BeautifulSoup
from lxml import etree
 
html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>'
 
# 方法一
pattern = re.compile(r'<[^>] >',re.S)
result = pattern.sub('', html)
print(result)
 <br># 方法二
soup = BeautifulSoup(html,'html.parser')
print(soup.get_text())
 
# 方法三
response = etree.HTML(text=html)
# print(dir(response))
print(response.xpath('string(.)'))
 
 
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好

对python去除html标签的方法就介绍到这了，对于这几个方法的使用还是比较简单的，希望本文能对大家有帮助，想要了解更多python去除html标签的方法，请关注群英网络其它相关文章。

标签：python去除html

免责声明：本站发布的内容（图片、视频和文字）以原创、转载和分享为主，文章观点不代表本网站立场，如果涉及侵权请联系站长邮箱：mmqy2019@163.com进行举报，并提供相关证据，查实之后，将立刻删除涉嫌侵权内容。

上一篇：pip install报错是什么原？如何解决？

下一篇：python装饰器怎样理解？如何使用？