自动检测字符串类型-chardet介绍

来源:互联网 发布:淘宝试用卖家不发货 编辑:程序博客网 时间:2024/06/05 22:50

处理网页时候,经常被各种编码搞晕了脑壳,直到后来遇到了 chardet模块



测试效果如下:


可以理解到, 对于 chardet总是需要输入  bytes序列。默认的字符串就是 bytes序列。

目前我的文档默认是 utf-8编码。


交互式测试2:



对于我输入的2个字符串,一个是 utf-8串,一个是 gbk串,都能够很好的猜测出来编码。

0 0