char类型与字符编码
来源:互联网 发布:手机淘宝 装修日记 编辑:程序博客网 时间:2024/06/04 06:37
char是字符类型,Java语言对字符采用Unicode字符编码。
由于计算机的内存只能存储二进制数据,因此必须为各个字符进行编码。
所谓字符编码,是指用一串二进制数据来表示特定的字符。
1)ASCII字符编码(American Standard Code for Information Interchange-美国信息互换标准代码)
a)它是一套罗马字母编码。
b)它是现今最通用的单字节编码系统。
c)它实际上只用了1字节的7位存储字符。
d)一共能表示128(2的7次方)个字符。
例程:a的编码为0110 0001,相当于十进制整数97
2)ISO-8859-1字符编码(又称Latin-1,是国际标准化组织[ISO]为西欧语言中的字符制定的编码)
a)西欧语言字符编码
b)1个字节(8位)来为字符编码
d)与ASCII字符编码兼容。(所谓兼容,是指对于相同的字符,它的ASCII字符编码和ISO-8859-1字符编码相同)
3)GBK2312字符编码
a)它是一套简体中文字符编码。
b)共收录7 445个字符。(包括6 763个汉字和682个其他符号)
c)与ASCII字符编码兼容。
4)GBK字符编码
a)是GB2312的扩展。
b)共收录21 886个字符。(包括汉字区和图形符号区;汉字:21 003)
c)与GB2312字符编码兼容。
5)Unicode字符编码(由国际Unicode协会编制)
a)收录了全世界所有语言文字中的字符。
b)是一种跨平台的字符编码。
c)Unicode具有两种编码方案。
1)用2个字节(16位)编码,采用这个编码方案的字符集被称为UCS-2,Java语言采用该编码方案。
2)用4个字节(32位)编码(实际只用了31位,最高位必须为0),采用这个编码方案的字符集被称为UCS-4.
6)UTF字符编码(UCS Transformation Format)
背景:有些操作系统不完全支持16位或32位的Unicode字符编码。
a)UTF字符编码能够把Unicode字符编码转换为操作系统支持的编码
b)它包括UTF-8(采用1个字节为单元对UCS进行编码),UTF-7,UTF-16
例程为UCS-2到UTF-8的字符编码转换方式
0x6C49在0x0800-FFFF之间,用第四行的模板:1110xxxx 10xxxxxx 10xxxxxx
将其写为二进制数据形式为:0110 110001 001001 用此代替模板中的x,11100110 10110001 10001001
7)Java语言的转义字符
a)\n:(next)换行字符,将光标定位在下一行的开头。
b)\t:(tab)垂直制表符,将光标移到下一个制表符的位置。
c)\r:(ready)回车,将光标定位在当前行的开头;不会跳到下一行。
d)\\:代表反斜杠字符
e)\':代表单引号字符
f)\":代表双引号字符
- char类型与字符编码
- 字符与字节、字符与编码、字符类型char和wchar_t
- char类型与Unicode编码
- char类型与Unicode编码
- char类型与Unicode编码
- char类型与Unicode编码
- char类型与Unicode的编码
- Win32中的字符编码与字符类型
- 使用字符:char类型
- 使用字符:char类型
- 期待char*类型字符
- String字符串与字符(char类型)数组互相转换
- char和unsigned char字符类型
- char类型和Unicode编码
- char类型及字符常量
- VS 字符编码类型转换 (wchar_t, char,TCHAR 的区别)
- VS 字符编码类型转换 (wchar_t, char,TCHAR 的区别)
- 字符编码类型解析
- 二叉树的遍历问题
- ArcGIS10中根据shapefile裁剪栅格影像
- 10个调试和排错的小建议
- IO流
- UVA 11996 Jewel Magic splay+字符串hash
- char类型与字符编码
- 猞猁云相册
- 自建一个WebApplicationInitializer
- Facebook注册机_Facebook账号注册_Csharp代码示例_.Net代码_VS2013
- Markdown 语法说明 (简体中文版)
- Struts文件上传
- Django forms 阅读笔记
- 随便记录
- R基本绘图总结(转载)