xml解析

来源:互联网 发布:知乎有文化有多可怕 编辑:程序博客网 时间:2024/04/27 01:05
  1. 在java应用开发中我们和xml打交道得机会太平凡了,一般情况下我看会用JDOM或是DOM4j来解析我们得XML文件,下面是一个Dom4j解析xml文件得例子,其中包括了对xml文件得取值、赋值、提取节点、节点得遍历等。
  2. SAXReader reader = new SAXReader();   
  3. Document doc = reader.read(...);   
  4. List childNodes = doc.selectNodes("//Config/Child/ChildNode");   
  5. for(Object obj:childNodes) {   
  6. Node childNode = (Node)obj;   
  7.   
  8. String name = childNode.valueOf("@name");   
  9. String text = childNode.getText();   
  10. }   
  11.   
  12.   
  13.   
  14. 一.Document对象相关  
  15.   
  16. 1.读取XML文件,获得document对象.  
  17.               SAXReader reader = new SAXReader();  
  18.               Document    document = reader.read(new File("input.xml"));  
  19.   
  20. 2.解析XML形式的文本,得到document对象.  
  21.               String text = "<members></members>";  
  22.               Document document = DocumentHelper.parseText(text);  
  23. 3.主动创建document对象.  
  24.               Document document = DocumentHelper.createDocument();  
  25.               Element root = document.addElement("members");// 创建根节点  
  26. 二.节点相关  
  27.   
  28. 1.获取文档的根节点.  
  29. Element rootElm = document.getRootElement();  
  30. 2.取得某节点的单个子节点.  
  31. Element memberElm=root.element("member");// "member"是节点名  
  32. 3.取得节点的文字  
  33. String text=memberElm.getText();也可以用:  
  34. String text=root.elementText("name");这个是取得根节点下的name字节点的文字.  
  35.   
  36. 4.取得某节点下名为"member"的所有字节点并进行遍历.  
  37. List nodes = rootElm.elements("member");  
  38.   
  39. for (Iterator it = nodes.iterator(); it.hasNext();) {  
  40.      Element elm = (Element) it.next();  
  41.    // do something  
  42. }  
  43. 5.对某节点下的所有子节点进行遍历.  
  44.             for(Iterator it=root.elementIterator();it.hasNext();){  
  45.                   Element element = (Element) it.next();  
  46.                 // do something  
  47.               }  
  48. 6.在某节点下添加子节点.  
  49. Element ageElm = newMemberElm.addElement("age");  
  50. 7.设置节点文字.  
  51. ageElm.setText("29");  
  52. 8.删除某节点.  
  53. parentElm.remove(childElm);// childElm是待删除的节点,parentElm是其父节点  
  54. 9.添加一个CDATA节点.  
  55.           Element contentElm = infoElm.addElement("content");  
  56.           contentElm.addCDATA(diary.getContent());  
  57.   
  58. 三.属性相关.  
  59. 1.取得某节点下的某属性  
  60.               Element root=document.getRootElement();      
  61.               Attribute attribute=root.attribute("size");// 属性名name  
  62. 2.取得属性的文字  
  63.               String text=attribute.getText();也可以用:  
  64. String text2=root.element("name").attributeValue("firstname");这个是取得根节点下name字节点的属性firstname的值.  
  65.   
  66. 3.遍历某节点的所有属性  
  67.               Element root=document.getRootElement();      
  68.             for(Iterator it=root.attributeIterator();it.hasNext();){  
  69.                   Attribute attribute = (Attribute) it.next();  
  70.                   String text=attribute.getText();  
  71.                   System.out.println(text);  
  72.               }  
  73. 4.设置某节点的属性和文字.  
  74. newMemberElm.addAttribute("name", "sitinspring");  
  75. 5.设置属性的文字  
  76.               Attribute attribute=root.attribute("name");  
  77.               attribute.setText("sitinspring");  
  78. 6.删除某属性  
  79.               Attribute attribute=root.attribute("size");// 属性名name  
  80.               root.remove(attribute);  
  81. 四.将文档写入XML文件.  
  82. 1.文档中全为英文,不设置编码,直接写入的形式.  
  83. XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));  
  84. writer.write(document);  
  85. writer.close();  
  86. 2.文档中含有中文,设置编码格式写入的形式.  
  87.               OutputFormat format = OutputFormat.createPrettyPrint();  
  88.               format.setEncoding("GBK");    // 指定XML编码          
  89.               XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);  
  90.               
  91.               writer.write(document);  
  92.               writer.close();  
  93. 五.字符串与XML的转换  
  94. 1.将字符串转化为XML  
  95. String text = "<members> <member>sitinspring</member> </members>";  
  96. Document document = DocumentHelper.parseText(text);  
  97. 2.将文档或节点的XML转化为字符串.  
  98.               SAXReader reader = new SAXReader();  
  99.               Document    document = reader.read(new File("input.xml"));              
  100.               Element root=document.getRootElement();                  
  101.               String docXmlText=document.asXML();  
  102.               String rootXmlText=root.asXML();  
  103.               Element memberElm=root.element("member");  
  104.               String memberXmlText=memberElm.asXML();  
  105.   
  106.   
  107.   
  108.   
  109. dom4j API 包含一个解析 XML 文档的工具。本文中将使用这个解析器创建一个示例 XML 文档。清单 1 显示了这个示例 XML 文档,catalog.xml。  
  110.   
  111. 清单 1. 示例 XML 文档(catalog.xml)   
  112. <?xml version="1.0" encoding="UTF-8"?>   
  113. <catalog>   
  114. <!--An XML Catalog-->   
  115. <?target instruction?>  
  116.    <journal title="XML Zone"   
  117.                    publisher="IBM developerWorks">   
  118. <article level="Intermediate" date="December-2001">  
  119. <title>Java configuration with XML Schema</title>   
  120. <author>   
  121.       <firstname>Marcello</firstname>   
  122.       <lastname>Vitaletti</lastname>   
  123. </author>  
  124.    </article>  
  125.    </journal>   
  126. </catalog>  
  127.    
  128.   
  129.   
  130. 然后使用同一个解析器修改 catalog.xml,清单 2 是修改后的 XML 文档,catalog-modified.xml。  
  131.   
  132. 清单 2. 修改后的 XML 文档(catalog-modified.xml)   
  133. <?xml version="1.0" encoding="UTF-8"?>   
  134. <catalog>   
  135. <!--An XML catalog-->   
  136. <?target instruction?>  
  137.    <journal title="XML Zone"  
  138.                     publisher="IBM developerWorks">   
  139. <article level="Introductory" date="October-2002">  
  140. <title>Create flexible and extensible XML schemas</title>   
  141. <author>   
  142.       <firstname>Ayesha</firstname>   
  143.       <lastname>Malik</lastname>   
  144. </author>   
  145.    </article>  
  146.    </journal>   
  147. </catalog>  
  148.    
  149.   
  150.   
  151. 与 W3C DOM API 相比,使用 dom4j 所包含的解析器的好处是 dom4j 拥有本地的 XPath 支持。DOM 解析器不支持使用 XPath 选择节点。  
  152.   
  153. 本文包括以下几个部分:  
  154.   
  155. 预先设置   
  156. 创建文档   
  157. 修改文档   
  158. 预先设置  
  159.   
  160. 这个解析器可以从 http://dom4j.org获 取。通过设置使 dom4j-1.4/dom4j-full.jar 能够在 classpath 中访问,该文件中包括 dom4j 类、XPath 引擎以及 SAX 和 DOM 接口。如果已经使用了 JAXP 解析器中包含的 SAX 和 DOM 接口,向 classpath中增 加 dom4j-1.4/dom4j.jar 。 dom4j.jar 包括 dom4j 类和 XPath 引擎,但是不含 SAX 与DOM 接 口。   
  161.   
  162.   
  163.   
  164.    
  165.   
  166.   
  167. 回页首   
  168.    
  169.   
  170.   
  171.   
  172. 创建文档  
  173.   
  174. 本节讨论使用 dom4j API 创建 XML 文档的过程,并创建示例 XML 文档 catalog.xml。  
  175.   
  176. 使用 import 语句导入 dom4j API 类:  
  177.   
  178. import org.dom4j.Document;  
  179. import org.dom4j.DocumentHelper;  
  180. import org.dom4j.Element;  
  181.    
  182.   
  183.   
  184. 使用 DocumentHelper 类创建一个文档实例。 DocumentHelper 是生成 XML 文档节点的 dom4j API 工厂类。   
  185.   
  186. Document document = DocumentHelper.createDocument();   
  187.   
  188.   
  189. 使用 addElement() 方法创建根元素 catalog 。 addElement() 用于向 XML 文档中增加元素。   
  190.   
  191. Element catalogElement = document.addElement("catalog");   
  192.   
  193.   
  194. 在 catalog 元素中使用 addComment() 方法添加注释“An XML catalog”。   
  195.   
  196. catalogElement.addComment("An XML catalog");   
  197.   
  198.   
  199. 在 catalog 元素中使用 addProcessingInstruction() 方法增加一个处理指令。   
  200.   
  201. catalogElement.addProcessingInstruction("target","text");   
  202.   
  203.   
  204. 在 catalog 元素中使用 addElement() 方法增加 journal 元素。   
  205.   
  206. Element journalElement =   catalogElement.addElement("journal");   
  207.   
  208.   
  209. 使用 addAttribute() 方法向 journal 元素添加 title 和 publisher 属性。   
  210.   
  211. journalElement.addAttribute("title", "XML Zone");  
  212.           journalElement.addAttribute("publisher", "IBM developerWorks");   
  213.   
  214.  
原创粉丝点击