utf-8与unicode的区别
来源:互联网 发布:淘宝详情页怎么套版 编辑:程序博客网 时间:2024/04/29 20:31
1.Unicode是一种字符集,而utf-8是一种编码方式。Unicode字符集既可以用utf-8编码方式编成计算机能够识别的二进制数值,也可以用utf-16,utf-32等方式编码。
2.Unicode并不是用两个字节表示世界上所有的文字,实际上世界上所有的文字分为17个平面,每个平面都有65536个,也就是需要两个字节来存储的字符数,所以单纯的两个字节不足以来表示世界上所有的文字。
3.utf-8编码方式编出来的结果中第一个字节中连续的1表示这个字符占多少个字节,按照百度百科中的介绍,把Unicode字符集中的字符编码换算成2进制,再填入百科中那些XXXXX的地方,就变成了utf-8的编码结果。
4.为什么不用固定的两个字节去编码Unicode字符集中的字符,见2
5.因为utf-8中没有全为0的字符(至少要有1个连续的1,来表示这个字符占多少个字节,见3),所以文本不会在第一个null字符时截断。而且由于utf-8中有一些固定的,有意义的(比如第一个字节中连续的1)二进制位,所以utf-8编码结果适合用于在网络中传输,因为他可以利用这些二进制位来纠错。
0 0
- Unicode与UTF-8/UTF-16/UTF-32的区别
- Unicode与UTF-8/UTF-16/UTF-32的区别
- utf-8与unicode的区别
- utf-8与unicode的区别
- UTF-8与Unicode的区别
- Unicode与UTF-8的区别理解
- Unicode与utf-8之间的区别
- UTF-8 与 unicode 区别
- UTF-8、UTF-16、Unicode的区别
- Unicode/UTF-8的区别
- Unicode/UTF-8的区别
- Unicode&UTF-8的区别
- UTF-8编码与Unicode编码的区别与联系
- Unicode与UTF-8的区别与联系
- Unicode UTF-8 UTF-16 UTF-32区别与联系
- 关于编码ansi、GB2312、unicode与utf-8的区别
- 关于编码ansi、GB2312、unicode与utf-8的区别
- ANSI,ASCII,Unicode,utf-8的区别与联系
- BT中的Tracker 简介 (P2P入门)
- LeetCode-Palindrome Partitioning
- cocos2d资源管理问题
- Codeforces 452B 4-point polyline (暴力出奇迹)
- android里camera支持的预览尺寸的获取
- utf-8与unicode的区别
- media对各种设备的判断-可以用于响应式设计
- Facebook也要玩智能眼镜
- UNIX环境编程笔记之STDIN_FILENO
- 第151天
- 线段树题目 汇总 讲解(by not only success)
- 使用XCode6打开项目以后再用XCode5出现的问题fatal error: malformed or corr
- WCF服务在IIS发布时遇到的一些配置问题
- unity3d导入jar包发布出现错误No resource found that matches the given name 'Theme.AppCompat.Light'.