UTF-8 编码介绍
来源:互联网 发布:centos挂载ntfs u盘 编辑:程序博客网 时间:2024/05/01 09:58
UTF-8 编码是一种被广泛应用的编码,这种编码致力于把全球的语言纳入一个统一的编码,目前已经将几种亚洲语言纳入。UTF 代表 UCS Transformation Format.
UTF-8 采用变长度字节来表示字符,理论上最多可以到 6 个字节长度。UTF-8 编码兼容了 ASC II(0-127), 也就是说 UTF-8 对于 ASC II 字符的编码是和 ASC II 一样的。对于超过一个字节长度的字符,才用以下编码规范:
左边第一个字节1的个数表示这个字符编码字节的位数,例如两位字节字符编码样式为为:110xxxxx 10xxxxxx; 三位字节字符的编码样式为:1110xxxx 10xxxxxx 10xxxxxx.;以此类推,六位字节字符的编码样式为:1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx。 xxx 的值由字符编码的二进制表示的位填入。只用最短的那个足够表达一个字符编码的多字节串。例如:
Unicode 字符: 00 A9(版权符号) = 1010 1001, UTF-8 编码为:11000010 10101001 = 0x C2 0xA9; 字符 22 60 (不等于符号) = 0010 0010 0110 0000, UTF-8 编码为:11100010 10001001 10100000 = 0xE2 0x89 0xA0
- UTF-8 编码介绍
- UTF - 8 编码格式简单介绍
- 【编码】unicode、ucs-2、ucs-4、utf-16、utf-32、utf-8 介绍
- 编码/字符集(UTF-8,UTF-16,UTF-32)的简单介绍
- ASCII 、GB2312、GBK、GB18030、unicode、UTF-8字符集编码介绍
- 编码介绍 ASCII与Unicode, codepage, utf-8
- GB2312、GBK、Unicode和UTF-8编码介绍
- 介绍一下unicode,ansi,utf-8,unicode big endian编码
- 介绍一下unicode,ansi,utf-8,unicode big endian编码
- 介绍ASCII,UNICODE,UTF-8等各种编码方案
- 编码介绍--gbk, gb2312,big5,unicode,utf-8,utf-16之间的关系
- Unicode(UTF-8, UTF-16)、Ansi、GB2312、GBK等编码介绍
- UTF-8编码规则
- UTF-8 编码
- UTF-8编码研究
- UTF-8编码规则
- 关于UTF-8编码
- 关于UTF-8编码
- 淹没在新技术中
- 这样吧
- 软件测试的误区
- 左连接查询
- 基于C的CAN总线切换方案
- UTF-8 编码介绍
- Complicated 歌词
- i can say ABC(2006-8-5)
- 安装Oracle9i弹出install的界面就不动了的问题
- 在跨入电子商务的大门之前,企业领导人要回答的几个问题
- 初次接触power architecture
- 从其他blog抄来的关于时间的名言,觉悟
- 在Asp.net中为图像加入版权信息
- MISSION AND VALUES