Unicode 和 UTF-8
来源:互联网 发布:中国阶层固化 知乎 编辑:程序博客网 时间:2024/05/16 19:18
Unicode是字符集,每一个字符都对应一个2/16进制的唯一编码,Unicode长度为2-4字节;
UTF-8是编码,根据Unicode重新编码一次,节省存储空间(英文1字节,中文3字节,最长6字节);
UTF-8mb4(UTF-8 more bytes 4)MySQL只支持3字节的UTF-8,UTF-8mb4就是支持4字节的UTF-8,如emoji表情就需要4字节的UTF-8;
Unicode转UTF-8规则(图片来自维基百科):
通俗一点:
- 所有的英文字母还是保留
ASCII
的编码规则(1字节),即英文编码还是0-127,兼容ASCII
- 如果字符大于2字节,则第一字节的前
n
位置为1,第n+1
位置为0
,余下所有字节高位都填充10
,然后依次将Unicode的二进制数填充即转成UTF-8
如:
CSDN的MD竟然不支持表格…
维基百科:https://zh.wikipedia.org/wiki/UTF-8
阅读全文
0 0
- UTF-8和Unicode
- unicode 和 UTF-8
- Unicode 和 UTF-8
- Unicode和utf-8
- unicode和utf-8
- Unicode和UTF-8
- Unicode 和 UTF-8
- Unicode和UTF-8
- Unicode和UTF-8
- utf-8和unicode
- UTF-8和unicode
- Unicode 和 UTF-8
- Unicode和Utf-8
- utf-8 和 unicode
- Unicode 和 UTF-8
- Unicode和UTF-8
- Unicode和UTF-8
- Unicode编码:UTF-8和UTF-16
- UVA
- netty源码分析(八)Netty的自适应缓冲区分配策略与堆外内存创建方式
- UVA
- bzoj1601 [Usaco2008 Oct]灌水
- 用EasyBCD硬盘安装Ubuntu
- Unicode 和 UTF-8
- 文档中100个记的英文
- UVA
- 关于二叉树的操作(一)
- 2017/9/23周测(CF2016-2017 ACM-ICPC Pacific Northwest Regional Contest (Div. 2))
- UVA
- HDU 5699 货物运输 ( 二分 + 不等式判断 )
- Java9 中的Jshell 操作
- Qt 学习笔记--------------------使用纯代码写dialog 与 UI文件