xml中的非法字符集范围
来源:互联网 发布:nginx 错误日志 编辑:程序博客网 时间:2024/05/19 02:31
今使用Jdom生成xml文件的时候,总是出现0x0,0x8为非法字符,经过搜索,问题原因及解决方法如下:
原因:
xml中需要过滤的字符分为两类,一类是不允许出现在xml中的字符,这些字符不在xml的定义范围之内。另一类是xml自身要使用的字符,如果内容中有这些字符则需被替换成别的字符。
第一类字符:
对于第一类字符,我们可以通过W3C的XML文档来查看都有哪些字符不被允许出现在xml文档中。
XML允许的字符范围是“#x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF]”。因此我们可以把这个范围之外的字符过滤掉。
需要过滤的字符的范围为:
//x00-//x08
//x0b-//x0c
//x0e-//x1f
第二类字符:
对于第二类字符一共有5个,如下:
字符 HTML字符 字符编码
和(and) & & &
单引号 ’ ' '
双引号 ” " "
大于号 > > >
小于号 < < <
我们只需要对这个五个字符,进行相应的替换就可以了
解决方法:
用正则表达式替换,
用正则表达式表示如下:[<>&'/"//x00-//x08//x0b-//x0c//x0e-//x1f]
- xml中的非法字符集范围
- 过滤xml中的非法字符串
- 删除xml中的非法字符
- xml中的非法字符处理
- XML规范中的字符集
- XML规范中的字符集
- 当心XML文件中的非法字符
- 剔除XML文件中的非法字符
- 关于 Exception:Xml中的非法字符
- XML中的非法字符及过滤方法
- xml中的非法字符 以及 处理
- iOS 过滤非法字符集
- php 忽略非法字符集
- web.config中的特殊字符串---xml中的非法字符串
- SSAS维度成员中的非法XML字符[转]
- 替换xml中的非法字符及不可见字符
- 字符集、字符编码、XML中的中文编码
- 字符集、字符编码、XML中的中文编码
- 在Linux下删除文件行末尾的^M符号方法
- php
- Android 官方博客 - Android应用程序的内存分析(翻译)
- Spring的事务管理入门:编程式事务管理(TransactionTemplate)!!!
- 分析待机、休眠、睡眠的区别和优缺点
- xml中的非法字符集范围
- JAVA基础加强_高新技术_收获四
- 今天面试,没做出来题。分享一下。
- 宏也可以有返回值
- Android中,SD卡上的媒体文件(图片、视频)的改变与通知
- 程序员人生之路(强烈推荐,分析的透彻!)
- java基础问题16
- 读《编程之美》有感—1的个数:数字x的个数
- 女程序员的苦恼情怀