dom4j特殊字符处理

来源:互联网 发布:百度新闻的评论 知乎 编辑:程序博客网 时间:2024/06/07 06:50

dom4j特殊字符处理

问题:

最近在做项目时,遇到了解析xml问题。

使用dom4j解析xml信息时,如果属性值中包含&等特殊字符时,解析会提示如下异常:

java.lang.RuntimeException: 生成Document对象异常


1.dom4j解析xml

经过查询得知dom4j在解析xml信息时,需要对一些特殊字符进行特殊处理:

下面是五个在XML文档中预定义好的实体:

&lt;<  小于号

&gt;>  大于号

&amp;&

&apos;' 单引号

&quot;"  双引号

比如你想输出“&”,那你的xml中要写成“&amp;”,当然你这个值是写在属性里的,是value=""这样的形式。


2.dom4j生成xml:

在使用dom4j生成xml文件时,对于特殊字符“&”,总会自动生成"&amp;",

因此在输入"<"或者">"时,&lt;代表<,结果将&转成"&amp;",就变成了"&amp;lt;",

因此在使用xsl生成html时造成"<"无法正常使用,解决方法是:

在创建writer对象时操作如下:

XMLWriter writer = new XMLWriter(fmt); //以输出格式为参数创建xml输出对象

 writer.setEscapeText(false);

这样&符号就不会被转义了。


请参阅dom4j文档

setEscapeText


public void setEscapeText(boolean escapeText)


    Sets whether text output should be escaped or not. This is enabled by default. It could be disabled if the output format is textual, like in XSLT where we can have xml, html or text output.     


    Parameters:

        escapeText - DOCUMENT ME!