java字符类型高低代理

来源:互联网 发布:最终幻想战略版 知乎 编辑:程序博客网 时间:2024/05/17 01:54

Java语言内部的字符信息使用UTF-16编码,因为char类型是16-bit,可以有65536种取值,每个编号代表一个字符。但是,Unicode包含的字符已经远远超过65536个。编码大于65536的,还想用16-bit,怎么办呢?
于是,Unicode标准组想出来的办法就是,从这65536个编码里面,拿出2048个,对顶它们是「Surrogates」,让他们两个位一组,来代表编号大于65536的那些字符。更具体地,编号为U+D800 至 U+DBFF 的规定为「High Surrogates」,共1024个。编号为 U+DC00 至 U+DFFF 的规定为「Low Surrogates」,也是1024个。它们两两组合出1048576个字符。

0 0
原创粉丝点击