您现在的位置是:群英 > 开发技术 > Python语言
Python去除html标签有哪些方法,你了解多少?
Admin发表于 2021-12-30 20:35:261100 次浏览

    Python去除html标签有哪些方法?有时候我们需要html标签,其中,Python去除html标签的常见方法有三种,接下来小编通过一个简单的示例给大家来介绍一下,更便于大家学习和理解,那么感兴趣的朋友就继续往下看吧。

    本文操作环境:windows7系统、python3.6.4版,DELL G3电脑。

    python去除html标签的几种方法

import re
from bs4 import BeautifulSoup
from lxml import etree
 
html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>'
 
# 方法一
pattern = re.compile(r'<[^>]+>',re.S)
result = pattern.sub('', html)
print(result)
 <br># 方法二
soup = BeautifulSoup(html,'html.parser')
print(soup.get_text())
 
# 方法三
response = etree.HTML(text=html)
# print(dir(response))
print(response.xpath('string(.)'))
 
 
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好

    以上就是Python去除html标签的三个方法看,从示例代码可见实现方法还是比较简单的,几行代码就能解决,有需要的朋友也可以了解看看,希望对大家学习Python语言有帮助,想要了解更多可以继续浏览群英网络其他相关的文章。

文本转载自PHP中文网

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。

相关信息推荐
2022-09-05 17:27:06 
摘要:3种实现方法:1、Set数据结构和“Array.from()”去重,语法“Array.from(new Set(arr))”;2、Set数据结构和扩展运算符“...”去重,语法“[...new Set(arr)]”;3、filter()和indexOf()过滤,语法“arr.filter((it,in)=>{return arr.indexOf(it,0)===in;});”。
2022-07-25 17:55:03 
摘要:bootstrap去掉边框的方法:首先打开相应的代码文件;然后通过设置css样式为“border:none”来去掉边框,或者使用样式“input:focus {outline: none;}”来去掉边框即可。
2022-05-06 18:01:46 
摘要:在php中,可以使用date()函数来判断本月是几月,该函数可以格式化当前日期,将其转为代表月份的字符串或数字,语法“date("格式字符")”;当格式字符为“F”或“M”时,可输出代表月份的英文单词,为“m”或“n”则输出代表月份的数字。
云活动
推荐内容
热门关键词
热门信息
群英网络助力开启安全的云计算之旅
立即注册,领取新人大礼包
  • 联系我们
  • 24小时售后:4006784567
  • 24小时TEL :0668-2555666
  • 售前咨询TEL:400-678-4567

  • 官方微信

    官方微信
Copyright  ©  QY  Network  Company  Ltd. All  Rights  Reserved. 2003-2019  群英网络  版权所有   茂名市群英网络有限公司
增值电信经营许可证 : B1.B2-20140078   粤ICP备09006778号
免费拨打  400-678-4567
免费拨打  400-678-4567 免费拨打 400-678-4567 或 0668-2555555
微信公众号
返回顶部
返回顶部 返回顶部