windows utf8 签名 一个很二的问题(经典乱码“锘”字)

来源:互联网 发布:arm linux关系 编辑:程序博客网 时间:2024/06/11 03:30

有时候用某个软件保存出xml 发现中文出现乱码,在txt,和vs里都能正常打开,可是用程序或者第三放库打开就是xml解析错误或者中文乱码

微软在自己的UTF-8格式的文本文件之前加上了EF BB BF三个字节

这绝对是很二的问题。 

涉及两种情况:1、无签名变有签名 notepad 另存为。

     2、有签名变无签名 暂时懒得找,下面有解决办法


以下为参考:

  这几天看了看 Ajax 的基础知识,在练习一个简单的 请求和响应时,PHP 返回来的数据 在 IE 中开头总显示 一个 “锘” 字!上网 Baidu 了一下,发现这是由于 系统 处理 UTF-8 的方法不同而导致的。

  php 返回的 UTF-8 数据 开头自动加了 标志,是对于 UTF-8的标识。对于 javascript 来说,不会在意这个标识,依然当作数据来读,所以就会出现 这个经典的 “锘”乱码。

  解决办法:把相关的文件源码复制到 Dreamweaver 里然后再保存就可以了。

  如果使用 windows 记事本 保存的 UTF-8 格式。使用UltraEdit编辑器,打开高级>配置>Unicode/utf-8 检测,把自动检测UTF-8文件,自动检测没有BOM的Unicode文件等前面的勾全去掉,然后你再打开那个文件,就会发觉“锘 ”这个字符出现了。


使用 Encoding.UTF8 是自动带 三 byte 的 BOM,如果要不添加 BOM。应该改用 UTF8Encoding utf8 = new UTF8Encoding(是否添加 BOM);

原创粉丝点击