java字符与字符集

来源:互联网 发布:windows美化大师下载 编辑:程序博客网 时间:2024/05/07 14:56
utf-8 : 每个字符占1到4个字节不等,最多有2的32次方个字符。 
unicode: 目前java中的char是两个字节,故目前java中只能表示2的16次方个unicode字符,有中文,但很多不常用的中文没有被包含,自然,有些小国语言的字符也没有被包含,为了容纳更多的字符,需要扩大char的字节数,以包含更多的unicode字符。 

utf-16: utf-8的容量也不够(最多有2的32次方个字符),所以再扩充,每个字符至少16bit即2个字节。 
utf-32:利用新的映射方式,每个字符至少32bit即4个字节。
原创粉丝点击