您现在的位置是:群英 > 开发技术 > 移动开发
在Python中html文件乱码情况如何处理
Admin发表于 2022-07-19 17:34:101343 次浏览
今天这篇给大家分享的知识是“在Python中html文件乱码情况如何处理”,小编觉得挺不错的,对大家学习或是工作可能会有所帮助,对此分享发大家做个参考,希望这篇“在Python中html文件乱码情况如何处理”文章能帮助大家解决问题。


python写入html文件中文乱码问题

使用open函数将爬虫爬取的html写入文件,有时候在控制台不会乱码,但是写入文件的html中的中文是乱码的

案例分析

看下面一段代码:

# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__':
    url = "http://www.renren.com/967487029/profile"

    rsp = request.urlopen(url)

    html = rsp.read().decode()    with open("rsp.html","w")as f:        # 将爬取的页面
        print(html)
        f.write(html)

看似没有问题,并且在控制台输出的html也不会出现中文乱码,但是创建的html文件中

解决方案

使用open方法的一个参数,名为encoding=” “,加入encoding=”utf-8”即可

# 爬虫未使用cookiefrom urllib import requestif __name__ == '__main__':
    url = "http://www.renren.com/967487029/profile"

    rsp = request.urlopen(url)

    html = rsp.read().decode()    with open("rsp.html","w",encoding="utf-8")as f:        # 将爬取的页面
        print(html)
        f.write(html)

运行结果



现在大家对于在Python中html文件乱码情况如何处理的内容应该都清楚了吧,希望大家阅读完这篇文章能有所收获。最后,想要了解更多在Python中html文件乱码情况如何处理的知识,欢迎关注群英网络,群英网络将为大家推送更多相关知识点的文章。

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。

标签: html文件乱码
相关信息推荐
2022-08-10 17:55:25 
摘要:python另起一行的方法:1、使用三个单引号可以进行换行;2、使用三个双引号可以进行换行;3、使用以【\】结尾可以进行换行。
2022-06-24 17:32:03 
摘要:bootstrap实现可关闭tab标签页的方法:首先引入jquery;然后引入“closable-tab-div”插件;最后通过语句“var item={'id':'1','name':'菜单管理','url':'...}”实现即可。
2022-05-31 17:40:52 
摘要:雪花算法生成id的方法:首先新建一个id生成的类;然后新建一个调用生成id的单例工具;最后使用函数【GuuidUtil.getUUID()】直接调用即可。
云活动
推荐内容
热门关键词
热门信息
群英网络助力开启安全的云计算之旅
立即注册,领取新人大礼包
  • 联系我们
  • 24小时售后:4006784567
  • 24小时TEL :0668-2555666
  • 售前咨询TEL:400-678-4567

  • 官方微信

    官方微信
Copyright  ©  QY  Network  Company  Ltd. All  Rights  Reserved. 2003-2019  群英网络  版权所有   茂名市群英网络有限公司
增值电信经营许可证 : B1.B2-20140078   粤ICP备09006778号
免费拨打  400-678-4567
免费拨打  400-678-4567 免费拨打 400-678-4567 或 0668-2555555
微信公众号
返回顶部
返回顶部 返回顶部