UTF-8笔记170330
来源:互联网 发布:北航软件学院 编辑:程序博客网 时间:2024/05/14 05:19
unicode
为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的
UTF-8使用可变长度字节来储存Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节
RFC 3629(utf-8)
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5(其实还包括了中日韩的),是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。
1字节7位
2
3
4
5
6
阅读全文
0 0
- UTF-8笔记170330
- ASCII,Unicode,UTF-8,UTF-16 学习笔记
- android--笔记--用utf-8编码字符串
- Python笔记:字符编码unicode/utf-8
- UTF-16, UTF-8
- UTF-16 UTF-8
- Python学习笔记:Convert UTF-8 with BOM to UTF-8 without BOM in Python
- Python学习笔记 --- utf-8与utf-8-sig 两种编码格式区别
- Python学习笔记:Convert UTF-8 with BOM to UTF-8 without BOM in Python
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian(转)
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- 字符编码终极笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- 字符编码终极笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- 字符编码笔记:ASCII、Unicode、UTF-8、UTF-16、UCS、BOM、Endian
- UTF-8、UTF-16、UTF-32
- ★如何证明自己不是精神病?
- 逻辑回归
- 如何定义立即执行函数?【转】
- 入门级五星好书之《编码》【推荐】
- Ioc容器 (精通Spring+4.x++企业应用开发实战 三)
- UTF-8笔记170330
- Java 上传文件至FTP服务器
- 图像多媒体笔记170327
- ★浅谈Spanking情节
- 地图收敛心得170405
- 玩转PS路径,轻松画logo!
- PS小实验-去除水印
- ★互联网告别免费时代,准备…
- 微信小程序 获取用户信息(包括openId等敏感信息)