字符编码
来源:互联网 发布:sublime js代码整理 编辑:程序博客网 时间:2024/05/29 12:33
ascii
iso8859-*
BIG5共共计13060个汉字
GB2312-80全称信息交换用汉字编码字符集 基本集。 GBK兼容gb2312, GB18030-2000是国家强制标准,也兼容gb2312 从1984年起,ISO组织就开始研究制定一个全新的标准:通用多八位编码字符集(Universal Multiple-Octet Coded Character Set),简称UCS。标准的编号为:ISO 10646。 统一码(Unicode)是Universal Code的缩写,是由另一个叫“Unicode学术学会”(The Unicode Consortium)的机构制定的字符编码系统。Unicode与ISO 10646国际编码标准从内容上来说是同步一致的。 在1991年,Unicode学术学会与ISO国际标准化组织决定共同制订一套适用于多种语言文本的通用编码标准。Unicode与ISO 10646国际编码标准于1992年1月正式合作发展一套通用编码标准。自此,两个组织便一直紧密合作,同步发展Unicode及ISO 10646国际编码标准。 UCS的结构是一个四维的编码空间,每一维由一个字节(八位二进制位)组成,范围是00到FF。总体上分为128个群组(Group 00-7F),每一群组由256个平面(Plane 00-FF)组成,每一平面有256行(Row 00-FF),每一行256个编码位(Cell 00-FF)。所以,每一平面包括65,536个字符位(Character Position 0000-FFFF)。 UCS将其第一个平面(00群组中的00平面)称作基本多语种平面(Basic Multilingual Plane,BMP)。 UCS有两种方式来表示一个字符编码:四字节正规形式(UCS-4,Four-octet canonical form)和双字节基本平面形式(UCS-2,Two-octet BMP form)。 UCS-4 —— 四字节正规形式 UCS-4用4个字节来表示一个字符。第一个字节表示组(Group),第二表示平面(Plane),第三表示行(Row),第四表示单元号或列(Cell)。 UCS-2 —— 双字节基本平面形式 当系统只使用BMP的字符码时,可以省略群组和平面中的八位,将字符码由32个位缩短为16个位(2个字节)。标记为UCS-2。 Unicode和UCS-2同样采用16位编码。所以一般可以把Unicode和UCS-2看作是同一样东西。
- 字符编码
- 字符编码
- 字符编码
- 字符 编码
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 编码&&字符
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 字符编码
- 我的计算机四级
- ASP.NET 菜单级别权限管理ORACLE数据库实现分析
- 测试的几个问题
- POJ 3636 俄罗斯Nested Dolls 贪心二分 动态规划
- 优先搜索算法
- 字符编码
- CentOS下xen虚拟机的安装与配置
- 计算机与生活之浪漫的密码爱情
- 新的选课
- As Easy As A+B
- POJ 1218 囚犯问题 数学题找规律
- RADIUS Accounting
- 各大有名库的介绍
- 关于线程start()方法重写