2.1字符编码相关知识点简介
来源:互联网 发布:海绵软件 编辑:程序博客网 时间:2024/06/18 09:46
unicode码:只是规定了什么数值表示什么字符;仅定义了一个映射表,没有具体的编码,如何存储字符就是编码。
1.有多种方式可以表示unicode码。
测试:abc中保存为下面四种方式。
ascii码: 中国大陆默认是GB2312。
utf-8:EF BB BF 最常用的编码方式。前三个字节表示utf-8编码。
utf-16le;FF FE
utf-16be: FE FF
2.为什么有多种方式来表示unicode码?
因为会造成字节浪费。
3.utf-8简要讲解。
最大的特点:它是一种变长的编码方式,可以使用1~4个字节来表示一个符号;根据不同的字符而改变字节的长度。
1)
对于单字节而言:字节的第一位设为0,其余7位是字符的unicode码。
对于英文字母:和ascii码相同。
2)对于n(n>1)字节的符号,前n为设为1,n+1为设为0;后面字节前两位设为10,剩下未提及到的都是unico码。
可以写一个简单的测试代码测试"abc中",同时保存为ascci和utf-8格式
注意:linux下测试需要对变量进行初始化为0;
测试发现:直接编译运行后ascci的编码不对。
为何?
因为默认是以utf-8解析的。
如何解决?
man gcc
搜索 /charset
得出编译时需要制定输入输出字符集,默认是utf-8解析的。
-finput-char=charset -fexec-charset=charset
输入字符集 输出字符集(程序执行是以什么编码执行的)
阅读全文
0 0
- 2.1字符编码相关知识点简介
- 字符集编码相关知识点
- 字符编码简介
- 字符编码简介
- 字符编码简介
- 字符编码简介
- 字符编码简介
- 字符编码简介
- Python字符编码简介
- 字符编码简介
- 字符编码简介
- 字符编码简介
- 常用字符编码简介
- 字符编码简介
- 字符编码简介
- 字符编码简介
- 字符编码相关
- 字符编码相关讲解
- Thinkphp 模型->快捷查询
- 文件上传Content-disposition中Attachment和inline的区别
- quartz快速入门(一)
- 理解高并发(19).volatile原理及用法
- Oracle 11g导出空表、少表的解决办法
- 2.1字符编码相关知识点简介
- CodeVS 3012 & 3037 线段覆盖4 & 5
- lcd驱动框架
- NYOJ题目36-最长公共子序列(经典动态规划题)
- shell解析命令行的过程以及eval命令
- 初识scala
- Qt+ffmpeg仿格式工厂:编程中遇到的问题(三)
- 51nod1265判断四点共面
- 【github myLocker】select监听多个fd,互斥锁保护终端交互