查看文件编码格式

来源:互联网 发布:移动硬盘分区软件 编辑:程序博客网 时间:2024/05/16 16:02

Windows中默认的文件编码格式是GBK(gb2312),而Linux一般都是UTF-8

可以通过记事本的另存功能生成不同的编码文件

Eclipse的Edit菜单中set Encoding可以方便查看对应的编码格式

 

python中不同的编码判断示例:

def encoding(as_string):
    ll_code = ['utf8', 'gbk']
    for cc in ll_code:
        try:
            as_string.decode(cc)
            return cc
        except:
            pass
    return 'unknown'


temp = '/xe6/xb5/x8b/xe8/xaf/x95'
print repr(temp.decode('utf8')), encoding(temp)


temp = '/xc5/xaf/xb1/xa6/xb1/xa6'
print repr(temp.decode('gbk')), encoding(temp)

 

一般乱码问题只要看:

head中是否设置字体,包括header("Content-type: text/html; charset=utf-8");或者

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

再检查文件本身的编码格式

 

原创粉丝点击