XML 文件中出现 & ® ™ 这类特殊字符的一种解决方法(from blog.joycode.com/ghj)
来源:互联网 发布:软件二次开发合同范本 编辑:程序博客网 时间:2024/06/07 19:49
这几天在跟一个公司合作的项目中,对方提供了RSS接口,通过这个接口,在我们网站展现出来,但是对方RSS中出现了一些麻烦的字符,比如 &,®,™ 等。这些字符放到XML中,如果不做特殊处理,就会有错误产生。比如下面的XML:
<item>&</item>
在IE 浏览器,以及一些解析用的DOM中解析这个片段,就会产生错误。
在W3C的技术规范中,也可以看到这样的字符不允许出现:
http://www.w3.org/TR/2001/REC-xml-c14n-20010315
比如:对 Text Nodes 允许的字符有如下要求: the string value, except all ampersands are replaced by &, all open angle brackets (< ) are replaced by <, all closing angle brackets (> ) are replaced by >, and all #xD characters are replaced by 
.
由于这些特殊字符比较多,我们在XML中替换的工作量比较大,我们可以在DTD文件中作些定义:
比如DTD文件中增加以下部分:
<!-- PERCENT SIGN -->
<!ENTITY amp "&#38;">
<!-- COPYRIGHT SIGN -->
<!ENTITY reg "®">
<!-- REG TRADE MARK SIGN -->
<!ENTITY trade "™">
并在XML中定义这个XML文件需要这个DTD支持:
<!DOCTYPE HeadCount SYSTEM "eula.dtd">
这样在XML文件中出现 & ® ™ 这类特殊字符就不会再报错了。
有关更多的特殊字符可以参看:
http://xml.coverpages.org/CourtDocument11-2002-05s-DTD.txt
那里罗列的特殊字符有近200个。
®
- XML 文件中出现 & ® ™ 这类特殊字符的一种解决方法(from blog.joycode.com/ghj)
- XML 文件中出现 & ? ? 这类特殊字符的一种解决方法
- XML中特殊字符出现乱码的解决方法
- web.config文件中出现特殊字符的解决方法
- 汗颜,写EnterpriseServices竟然忘了设置ComVisible了 http://blog.joycode.com/ghj/archive/2006/10/24/75866.aspx
- http://blog.joycode.com/saucer/
- xml文件中特殊字符的处理
- XML文件中不允许出现的字符
- sax解析xml的特殊字符解决方法
- Xml中特殊字符的处理
- XML中特殊字符的处理
- xml中特殊字符的处理
- XML中特殊字符的处理
- XML中特殊字符的处理方式
- xml中一些特殊字符的表示
- C#中Xml特殊字符的处理
- XML中特殊字符的处理
- XML的特殊字符
- 第一篇文章:开个头吧,我是搞软工的,希望把自己的思路写出来,大家一起学习了。
- Tomcat4/5连接池的设置及简单应用示例
- 1%的GDP
- 将数字转换成中文大写的算法
- 又发烧了
- XML 文件中出现 & ® ™ 这类特殊字符的一种解决方法(from blog.joycode.com/ghj)
- 有关杀病毒
- CVS常用命令速查手册 选择自 zaowei21 的 Blog
- 21世纪东方美女标准[男士参考女士学习]
- 逐段注释--最简单,最方便,最快速,最实用,最高效,最清晰,最直接,最好的调试方法
- 在ASP.NET用MD5加密
- Google 和 Googol - 背景趣味
- Eclipse中你一定见过-vmargs -Xmx ...
- 圣诞寄语