字符编码

来源:互联网 发布:淘宝怎么增加颜色分类 编辑:程序博客网 时间:2024/05/22 05:11

        最近领导要求找一下不同字符集编码之间的关系,以便修改我们的产品来支持更多的字符集,查找了半天竟然没有找到直接进行转换的方法,因此特发出查找结果,希望看到此文章并对字符编码转换有所研究的朋友赐教一下。

       要求GB18030-2005和UTF-8之间转换关系。

      查找结果:貌似不能直接进行转换,得借助一个UNICODE编码方式进行中转。目前找到UTF-8和UNICODE之间的简单变换方式,但GB18030和UNICODE之间没有找到除了查表以外更简单的方法。而且之后还考虑了GBK和GB2312有什么办法转到UNICODE去,都没有找到好方法(查表需要的资源较多,特殊原因无法采用)。搜了很多论文好像都是研究怎么加快查表法速度的,而且看了看其它语言实现的方法所调用的库函数都是指定了代码页进行查表。找到的包含关系貌似是下面那样的。GB18030的单字节区,双字节区,四字节区有部分可以简单对应过去,但是其它部分没有找到简单对应方法,希望有所研究的人指教一下,万分感激。