关于中文文件名字转码

来源:互联网 发布:域名冲突 编辑:程序博客网 时间:2024/05/01 20:06

在Unix服务器上中文一般以utf-8表示,而是用IIS同步的文件可能是以gb2312编码的。

现在服务器上这两种编码的文件都存在。 

 

IE浏览器默认是用utf-8编码发送中文URL,迅雷比较猛,可以尝试多种编码方法。

这样就出现了一种情况,有时IE会下载不了服务器上名字以gb2312编码的文件。

 

解决方法:服务器保存两个文件对应相同,即两种编码对应不同文件名字。

 

开始尝试判断文件编码类型,失败告终。

是用perl Encode模块的一个函数(is_utf8),后来证明是不可行的。该函数并不能判断编码方式。

后改用强制转换,但是效果不好,可能会出现错误转换的情况。

 

 

 

 

后来用C写了个。效果比较好,使用了软连接。 iconv判断字符编码还是比较准确的。

 

 

 

 

这种解决方法是被迫的,最好的解决方案是统一使用utf8编码,这样就避免了各种编码混乱带来的不便。

原创粉丝点击