汉字的不同编码表示
来源:互联网 发布:大数据傻瓜式 编辑:程序博客网 时间:2024/05/22 12:14
汉字用不同的编码方式有不同的实现,下面以ANSI、Utf-8、Utf-16为例进行表示
以汉字中的“ 汉 ”为例
(1) 在Ansi中,一个英文占用一个char,一个汉字则占用两个char(会用到负值)
调试查看,其表示为:-70 -70
对应的十六进制表示为:BA BA
与用Ultra Edit查看得到的结果相同。
Utf-8、Utf-16都是Unicode编码方式的实现
“ 汉 ”的Unicode码为:0x6c49
(2) Utf-8为Unicode的变长编码实现,即一个字符可能用1-4个字节来表示(具体查看Unicode编码方案简介及实现)
E6 B1 89
(3) Utf-16一个字符用2个字节来表示
在调试时,发现” 汉 “的表示为:27721
对应的十六进制表示为:6C49
使用代码如下:
Windows、VC++
char sBuf[10]={0};strcpy(sBuf, "汉字");wchar_t wBuf[10]={0};wcscpy(wBuf, L"汉字");然后调试、查看内存
- 汉字的不同编码表示
- 计算机中汉字的二进制编码表示
- 汉字的编码
- 汉字的Unicode编码
- 关于汉字的编码
- 汉字的编码
- 数据的编码表示
- 汉字不同编码转换的问题 UCS2转码的心得
- 不同字符集编码的英文字母和中文汉字的字节数
- 英文字母和中文汉字在不同字符集编码下的字节数
- 英文字母和中文汉字在不同字符集编码下的字节数
- 英文字母和中文汉字在不同字符集编码下的字节数
- 英文字母和中文汉字在不同字符集编码下的字节数
- 英文字母和中文汉字在不同字符集编码下的字节数
- 英文字母和中文汉字在不同字符集编码下的字节数
- 在utf8和gb2312中 不同编码情况下,汉字 数字 英文占的字节数?
- 英文字母和中文汉字在不同字符集编码下的字节数
- ******英文字母和中文汉字在不同字符集编码下的字节数 英文字母:******
- kernel 启动过程之五, initcall 的来由, console 的初始化
- Windows下用Scons编译QT程序
- Business Intelligence Center
- cocos2d-x实现node圆弧运动
- [Mac]Mac键盘常用快捷键
- 汉字的不同编码表示
- linux 修改主机名(抄的)
- [Java]读取文件方法大全
- C# Enum,Int,String的互相转换 枚举转换
- HTC部分手机WiFi漏洞存在网络安全问题
- 学习《Thinking in java》笔记二
- 搭建 Android X86 系统,替代AVD模拟器,解决运行效率慢的问题(整理)====大全
- 基于 Alchemy 实现 AS3 与 C++ 交互(1)C++ 回传 Array 给 AS3
- MD5加密