Unicode的解决方案

来源:互联网 发布:阿里云ecs上传文件 编辑:程序博客网 时间:2024/06/13 21:39
1. ASCII 的第一个字母 A 代表 American 美国,严重的突出了它的局限性。


2. ANSI 编码标准有一些共同的特点:

  • 每种 ANSI 字符集只规定自己国家或地区使用的语言所需的'字符',比如简体中文编码标准 GB-2312 的字符集中就不会包含韩国人的文字。
  • ANSI 字符集的空间都比 ASCII 要大很多,一个字节已经不够,绝大多数 ANSI 编码标准都使用多个字节来表示一个字符。
  • ANSI 编码标准一般都会兼容 ASCII 码。


3. 为了解决乱码等诸多问题,Unicode 将世界上所有的符号都纳入其中,每一个符号都给予一个独一无二的编码。


4. Unicode其实就是对双字节字符集出现的问题做了一下改进:

  • 统一所有的字符使用两个字节来存放
  • 将所有国家的语言都放到一个字符集里


5. UTF 规定 Unicode(UCS)应该如何存储,UTF 有三种方案,分别是 UTF-8(最广泛使用),UTF-16(标准的 Unicode 编码方案)和 UTF-32


6. Windows NT 架构全面支持 Unicode,在今后的编程中,我们应该尽量使用 Unicode 才符合时代发展的趋势。


7. Windows 编程中,使用 TEXT() 将字符串括起来可以解决编码问题。


8. Windows 编程中,使用 TCHAR 来定义字符及字符串。


9. 在宽字符的环境里,Windows 自动将 TCHAR 替换为 C 语言的 wchar_t 类型,TEXT() 自动在字符串前加 L 标识。
阅读全文
0 0
原创粉丝点击