爬行不同的网页时,返回结果会出现乱码现象。例如,在爬行某一中文网页时,有些网页使用GBK/GB2312,有些网页使用UTF8,如果你需要爬行某一网页,了解网页编码非常重要。
1、说明
HTML页面上有charset标签,但有时它是错误的,因此chardet可以帮助我们。使用chardet可以方便地实现字符串/文件的编码检测。
如果安装了Anaconda,可以直接使用chardet。如果只安装了Python,需要使用以下代码完成安装。
2、安装命令
pip install chardet
使用下面这行代码,导入chardet库。
import chardet
以上就是python中chardet库的安装和导入,希望对大家有所帮助。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。