Python去除html标签有哪些方法?有时候我们需要html标签,其中,Python去除html标签的常见方法有三种,接下来小编通过一个简单的示例给大家来介绍一下,更便于大家学习和理解,那么感兴趣的朋友就继续往下看吧。
本文操作环境:windows7系统、python3.6.4版,DELL G3电脑。
python去除html标签的几种方法
import re from bs4 import BeautifulSoup from lxml import etree html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>' # 方法一 pattern = re.compile(r'<[^>]+>',re.S) result = pattern.sub('', html) print(result) <br># 方法二 soup = BeautifulSoup(html,'html.parser') print(soup.get_text()) # 方法三 response = etree.HTML(text=html) # print(dir(response)) print(response.xpath('string(.)')) # 你好哈哈大家好 # 你好哈哈大家好 # 你好哈哈大家好
以上就是Python去除html标签的三个方法看,从示例代码可见实现方法还是比较简单的,几行代码就能解决,有需要的朋友也可以了解看看,希望对大家学习Python语言有帮助,想要了解更多可以继续浏览群英网络其他相关的文章。
文本转载自PHP中文网
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。