ES6-字符串扩展-Unicode

来源:互联网 发布:压缩json 编辑:程序博客网 时间:2024/05/17 06:30

ES6加强了对 Unicode 的支持,并且扩展字符串对象。

字符的 Unicode 表示法

JavaScript允许采用 \uxxxx 形式表示一个字符,其中 xxxx 表示字符的 Unicode 码点。

1)字符串与 Unicode 编码的相互转换

'你好'.charCodeAt(0).toString(16)//'4f60'
上面代码将字符串‘你好’,转化为 Unicode 编码,

'你好'.charCodeAt(0).toString(16)// '4f60''你好'.charCodeAt(1).toString(16)// '597d'

charCodeAt() 方法可返回指定位置的字符的 Unicode 编码,这个返回值是 0~ 65535 之间的整数。toString() 就是将字符串转化为 16 进制了。

上面代码块的第二行中,实际输出的是字符串'好'的 Unicode 编码,因此如果你想知道单个字符串的编码,就是靠charCodeAt()里面的参数,也就是索引查看。

'\u597d'// 好
要是想把 Unicode 解码成字符就要用转义字符 '\u'

2)根据上文表示法,只限于码点在 '\u0000' - '\uffff' 之间的字符,如果超出这个范围,就必须用双字节的形式表示。

'\uD842\uDFB7'//