最新消息: 关于Git&GitHub 版本控制你了解多少?
您现在的位置是:群英 > 开发技术 > Python语言 >
python去除html标签的方法有什么?你知道多少?
PHP中文网发表于 2021-09-26 18:06 次浏览

    python去除html标签的方法有什么?在Python中,我们想要去除html标签有很多方法,例如使用pattern.sub('',html)方法、BeautifulSoup(html,'html.parser')方法或者response.xpath('string(.)')方法,那么具体怎样做呢?下面我们一起来看看。

    本文操作环境:windows7系统、python3.6.4版,DELL G3电脑。

    python去除html标签的几种方法

import re
from bs4 import BeautifulSoup
from lxml import etree
 
html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>'
 
# 方法一
pattern = re.compile(r'<[^>] >',re.S)
result = pattern.sub('', html)
print(result)
 <br># 方法二
soup = BeautifulSoup(html,'html.parser')
print(soup.get_text())
 
# 方法三
response = etree.HTML(text=html)
# print(dir(response))
print(response.xpath('string(.)'))
 
 
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好    

    对python去除html标签的方法就介绍到这了,对于这几个方法的使用还是比较简单的,希望本文能对大家有帮助,想要了解更多python去除html标签的方法,请关注群英网络其它相关文章。

标签:python去除html
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
相关信息推荐