unicode和UTF-8的不同(The difference between UTF-8 and Unicode?)
来源:互联网 发布:知乎 商城模块 编辑:程序博客网 时间:2024/06/11 14:30
首先,我想说的是UTF-8和unicode根本没有可比性。UTF-8是一种编码方式(或者叫做算法),而Unicode一种字符集( Universal Character Set),两种完全不是一个世界的东西。
程序知道读取的是Unicode字符,并且是用UTF-8编码的,那么程序就用UTF-8解码上面的数据,得到:
总结:
当有人问道这两者有什么不同时,怎么简介正确的回答呢?
首先说说Unicode字符集(Unicode characters)
Unicode字符集将世界上所有语言的所有符号(用于在计算机上显示和打印的字符和符号)包括进来,并且用一个唯一的数字(码值,code points)标示。例如,Unicode集中字母A的码值为65,通常用16进制表示且加上前缀U+,即U+0041。查看Unicode字符列表点击List of Unicode Set
再说说UTF-8
UTF-8是将数字(就是上面说的“码值”)转换成二进制串的方式(算法),存盘的时候就是存储这些二进制串。例如将1234将转成:
00000001 00000010 00000011 00000100这样,1234就是这样以二进制文件的方式存盘的。
综合UTF-8和Unicode说说
假设程序从磁盘中读取
1101000 1100101 1101100 1101100 1101111
程序知道读取的是Unicode字符,并且是用UTF-8编码的,那么程序就用UTF-8解码上面的数据,得到:
104 101 108 108 111程序根据这些标示Unicode字符的数字,解码数Unicode字符串:
hello
总结:
当有人问你Unicode和UTF-8之间的不同,你可以自信地简洁精确地告诉他:
Unicode和UTF-8没有可比性。Unicode是一种字符集,用来映射数字(码值)和字符的。UTF-8是一种编码方式,用来转换数字(码值)和二进制串的。
0 0
- unicode和UTF-8的不同(The difference between UTF-8 and Unicode?)
- What's the difference between UTF-8 and Unicode?
- Unicode and UTF-8
- Conversion Between Unicode-UCS-4 And UTF-8 (Unicode-UCS-4 与 UTF-8 之间的转换)
- UTF-8和Unicode
- unicode 和 UTF-8
- Unicode 和 UTF-8
- Unicode和utf-8
- unicode和utf-8
- Unicode和UTF-8
- Unicode 和 UTF-8
- Unicode和UTF-8
- Unicode和UTF-8
- utf-8和unicode
- UTF-8和unicode
- Unicode 和 UTF-8
- Unicode和Utf-8
- utf-8 和 unicode
- hdu 5057 Argestes and Sequence(BestCoder Round #11)
- Matlab常用函数(1)
- 加州理工学院公开课:机器学习与数据挖掘_线性模型 II(第九课)
- 算法9:开启“树”之旅
- 比较对象的时候复写equals方法
- unicode和UTF-8的不同(The difference between UTF-8 and Unicode?)
- 深入理解javascript原型和闭包(17)——补this
- html在文本框中加入滚动条
- 笔记---Linux---Vim自动补齐的配置
- 密度聚类(Density peaks Clustering)Python实现
- noip10-04-14
- CM 4.4 Launcher Fix the error and import adt
- Docker源码分析(一):Docker架构
- 网页常用模块名称