What the hell is "锟斤拷"?

来源:互联网 发布:esframework 6.2源码 编辑:程序博客网 时间:2024/04/29 19:52
在win下面ssh到一台UTF8的FREEBSD上,如果不调PUTTY的编码,就老是看到"锟斤拷"

锟斤拷是一种计算机软件系统内部错误编码导致的文字不正常显示的现象。


Unicode标准中定义了一个Replacement Character,标记为U+FFFD,作用为:

A character used as a substitute for an uninterpretable character fromanother encoding. The Unicode Standard uses U+FFFD replacementcharacter for this function.



U+FFFD的UTF-8编码结果为“EF BF BD”。如果有一大段文字都是采用了“U+FFFD U+FFFD”作为占位符的话,那么这段字符的UTF-8流十六进制格式为“EF BF BD EF BF BD...”。

如果错误的放置于GB2312/GBK/CP936编码环境里显示的话,最终字符为锟斤拷,他们分别是锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)。由于Web大量采用Gb2312和UTF-8混合编码,该现象在互联网十分普遍。
原创粉丝点击