最新消息: 关于Git&GitHub 版本控制你了解多少?
您现在的位置是:群英 > 开发技术 > Python语言 >
python怎样清除html文件中的内容?方法是什么?
PHP中文网发表于 2021-09-24 17:39 次浏览

    python怎样清除html文件中的内容?Python要实现清除html文件中的内容有很多方法,例如使用join方法或者compile方法等等,接下来小编给大家分享几个Python清除html文件中的内容的方法及实例,感兴趣的朋友可以参考。

    本教程操作环境:windows7系统、python3.9版,DELL G3电脑,该方法适用于所有品牌电脑。

    python清除html文件中内容的方法:

    方法1:

In [97]: str_ = ''
    ...: flag = 1
    ...: for ele in test:
    ...:     if ele == "<":
    ...:         flag = 0
    ...:     elif ele == '>':
    ...:         flag = 1
    ...:         continue
    ...:     if flag == 1:
    ...:         str_  = ele
    ...:         
In [98]: str_
Out[98]: 'just for testjust for testtest'
In [99]: str_ = ''
    ...: flag = 1
    ...: for ele in test:
    ...:     if ele == "<":
    ...:         flag = 0
    ...:     elif ele == '>':
    ...:         flag = 1
    ...:         ele = ' '
    ...:     if flag == 1:
    ...:         str_  = ele
    ...:         
In [100]: str_
Out[100]: ' just for test   just for test  test '

    方法2:

import re
In [156]: pat = re.compile('(?<=>).*?(?=<)')
In [157]: pat.findall(test)
Out[157]: ['just for test', '', '', 'just for test', '', 'test']
In [158]: ''.join(pat.findall(test))
Out[158]: 'just for testjust for testtest'

    方法3:

pat = re.compile('>(.*?)<')
''.join(pat.findall(test))

    方法4:

In [167]: pat = re.compile('<[^>] >', re.S)
In [168]: pat.sub('', test)
Out[168]: 'just for testjust for testtest'

    对python清除html文件中的内容的方法就介绍到这了,上述实例有一定的参考价值,感兴趣的朋友可以了解看看,希望大家阅读完这篇文章能有所收获,想要了解更多请关注群英网络其它相关文章。

标签:
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
相关信息推荐