dom4j 中文乱码问题
来源:互联网 发布:销售数据 编辑:程序博客网 时间:2024/05/17 11:36
在用 dom4j 以 utf8 编码格式生成 xml 文档后,发现该 xml 文档包含中文的部分异常,无法读取。随后被逼无奈,只好使出猥琐招数,直接将要写入 xml 的字符串重新以 utf8 格式编码后再写入 xml:
str = new String(str.getBytes(), "UTF8");
终于,xml 文档异常消除,可以正常读取。然而,其中的中文部分是却乱码,悲了个剧,事情为什么是这个样子呢?
终于知道:问题在于 FileWriter 类的滥用,将 FileWriter 改为 FileOutputStream 之后,问题解决。
1 dom4j 中 XMLWriter 对文件的处理过程:
public XMLWriter(OutputStream out) throws UnsupportedEncodingException { this.format = DEFAULT_FORMAT; this.writer = createWriter(out, format.getEncoding()); this.autoFlush = true; namespaceStack.push(Namespace.NO_NAMESPACE); } public XMLWriter(OutputStream out, OutputFormat format) throws UnsupportedEncodingException { this.format = format; this.writer = createWriter(out, format.getEncoding()); this.autoFlush = true; namespaceStack.push(Namespace.NO_NAMESPACE); } protected Writer createWriter(OutputStream outStream, String encoding) throws UnsupportedEncodingException { return new BufferedWriter( new OutputStreamWriter( outStream, encoding )); }
结论:dom4j 在生产 xml 文档时,构造其 XMLWriter 所需参数为 OutputStream 对象,而非 Writer 对象。
2 示例:
public void createXML(String fileName) { Document doc = DocumentHelper.createDocument(); Element rootElement = doc.addElement("animal"); rootElement.addAttribute("name", "汤姆猫"); Element ageElement = rootElement.addElement("age"); ageElement.setText("3岁"); Element colorElement = rootElement.addElement("color"); colorElement.setText("黄色"); try { OutputFormat format = OutputFormat.createPrettyPrint(); format.setEncoding("UTF-8"); //XMLWriter xmlWriter = new XMLWriter(new FileWriter(fileName), format); XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(fileName), format); xmlWriter.write(doc); xmlWriter.close(); } catch (Exception e) { System.out.println(e); }}
- dom4j 中文乱码问题
- dom4j 中文乱码问题
- dom4j中文乱码问题
- dom4j 中文乱码问题
- DOM4J的中文乱码问题
- Java Dom4j 解决中文乱码问题
- dom4j生成xml文件,解析后出现中文乱码问题
- DOM4J生成XML文件的中文乱码问题
- dom4j的乱码问题
- dom4j的乱码问题
- DOM4J乱码问题
- DOM4J的中文问题
- DOM4J中文路径问题
- DOM4J中文路径问题
- dom4j生成xml文件的中文乱码
- dom4j生成xml文件的中文乱码
- Dom4j中的中文编码问题
- Dom4j中的中文编码问题
- 游戏外挂基本原理及实现
- 模板类
- 英语写作句型之一
- java 追加写文件
- 阶乘的精确值
- dom4j 中文乱码问题
- 利用JAVA API函数实现数据的压缩与解压缩(转自developerWorks 中国)
- java 生成一个随机字符串
- SQLPLus的一些常用的基本操作
- 【理想流】程序员可能少加班么?
- OpenCV自带例子 (十) 图像几何变换
- ftplib模块--编写ftp客户端程序
- 工作流 --BPMN
- 再写 Hash (C++)