python爬虫乱码问题

来源:互联网 发布:电脑打开软件特效 编辑:程序博客网 时间:2024/06/05 20:43

在遇到中文字符乱码问题,归根结底就是因为编码格式不匹配,解决方法如下:

1、确定源网页的编码,如果是charset=“gb2312”,则在程序中要用gb18030。其他的对应相同即可。



2、将IDE中的编码格式也改成对应的编码格式。同样的如果是charset=“gb2312”,则在程序中要用gb18030。其他的对应相同即可。

文件--》settings--》Editor--》File Encodings



3、代码中的编码格式也需要和前两者对应起来,设置输出编码格式。(记得import sys哦)同样的如果是charset=“gb2312”,则在程序中要用gb18030。其他的对应相同即可。