utf-8与unicode的区别
来源:互联网 发布:网络机房工程报价清单 编辑:程序博客网 时间:2024/05/17 08:09
1.Unicode是一种字符集,而utf-8是一种编码方式。Unicode字符集既可以用utf-8编码方式编成计算机能够识别的二进制数值,也可以用utf-16,utf-32等方式编码。
2.Unicode并不是用两个字节表示世界上所有的文字,实际上世界上所有的文字分为17个平面,每个平面都有65536个,也就是需要两个字节来存储的字符数,所以单纯的两个字节不足以来表示世界上所有的文字。
3.utf-8编码方式编出来的结果中第一个字节中连续的1表示这个字符占多少个字节,按照百度百科中的介绍,把Unicode字符集中的字符编码换算成2进制,再填入百科中那些XXXXX的地方,就变成了utf-8的编码结果。
4.为什么不用固定的两个字节去编码Unicode字符集中的字符,见2
5.因为utf-8中没有全为0的字符(至少要有1个连续的1,来表示这个字符占多少个字节,见3),所以文本不会在第一个null字符时截断。而且由于utf-8中有一些固定的,有意义的(比如第一个字节中连续的1)二进制位,所以utf-8编码结果适合用于在网络中传输,因为他可以利用这些二进制位来纠错。
阅读全文
0 0
- Unicode与UTF-8/UTF-16/UTF-32的区别
- Unicode与UTF-8/UTF-16/UTF-32的区别
- utf-8与unicode的区别
- utf-8与unicode的区别
- UTF-8与Unicode的区别
- Unicode与UTF-8的区别理解
- Unicode与utf-8之间的区别
- UTF-8 与 unicode 区别
- UTF-8、UTF-16、Unicode的区别
- Unicode/UTF-8的区别
- Unicode/UTF-8的区别
- Unicode&UTF-8的区别
- UTF-8编码与Unicode编码的区别与联系
- Unicode与UTF-8的区别与联系
- Unicode UTF-8 UTF-16 UTF-32区别与联系
- 关于编码ansi、GB2312、unicode与utf-8的区别
- 关于编码ansi、GB2312、unicode与utf-8的区别
- ANSI,ASCII,Unicode,utf-8的区别与联系
- Ubuntu和Win10双系统
- negative
- web前端开发中button标签点击后导致页面刷新
- golang 中的md5 、hmac、sha1算法的简单实现
- 10:大整数加法
- utf-8与unicode的区别
- Python同时安装py2.x和py3.x,以及Windows下virtualenv和flask的安装
- 哆啦A梦的时光机
- Hibernate Transformers
- 联合作战态势可视化分析决策系统
- 单例模式的七种写法
- C++广度优先搜索算法之鸣人与佐助
- ab测试
- Java FileInputStream默认编码方式