ASCII,Unicode,UTF-8编码

来源:互联网 发布:淘宝淘金币怎么用 编辑:程序博客网 时间:2024/06/07 23:33

我们都知道,我们的信息存储在计算机中,最终都是二进制的字符串,每一位都有0和1两种状态。而一个字节(byte)有8位,一共可以有256种不同的状态。

ASCII码就是美国制定的一种字符编码,规定了英语字母与二进制的对应关系。ASCII码只规定了128个字符,一种占用了一个字节的7位,最前面的一位为0.

随着计算机的不断普及,每个国家,各种不同的语言,都需要存储在计算机中。这样不同的语言,形成了不同的编码体系。因此在打开一个文件的时候需要首先知道它的编码方式,后来,就有了Unicode,它把世界上所有的符号都纳入其中,每一个字符都有一个独一无二的二进制流。它规定每个字符占两个字节,对于英文字符,高8位全部是0.

随着互联网的普及,网络传输的过程中也需要一个标准,这就有了UTF,Unicode到UTF并不是直接对应,而是需要一个算法转换。值得注意的是,UTF-8是一种变长的编码方式,用1-4个字节存储,不同的字符会有不同的长度。

参考资料:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

http://blog.csdn.net/hjsunj/article/details/2223766   

0 0
原创粉丝点击