使用JDOM解析XML文件

来源：互联网发布：中国航空结算知乎编辑：程序博客网时间：2024/06/06 03:02

一、前言
JDOM是Breet Mclaughlin和Jason Hunter两大Java高手的创作成果，2000年初，JDOM作为一个开放源代码项目正式开始研发。JDOM是一种解析XML的Java工具包。
DOM适合于当今流行的各种语言，包括Java,JavaScripte,VB,VBScript，Perl,C,C++等。它了为HTML和XML文档提供了一个可应用于不同平台的编程接口。W3C DOM的最新信息可从http://www.w3.org/TR2001/WD-DOM-Lever-3-Core-20010913查阅。微软在http://msdn.microsoft.com/library/default.asp?url=/library/en-us/xmlsdk30/htm/xmconxmldomuserguide.asp上也有DOM的详细技术信息。
DOM的设计为了适用于不同的语言，它保留了不同语言中非常相似的API。但是它并不适合于Java编程者的习惯。而JDOM作为一种轻量级API被制定，它最核心的要求是以Java为中心，只适合于Java语言，它遵循DOM的接口主要规则，除去了DOM中为了兼容各语言而与Java习惯的不同。
二、使用JDOM的前提条件
须要有SAX、DOM解析器的类文件，JDOM只是一种适合Java程序员来使用的Java XML解析器，目前流行的javaXML解析器还有：Apache Xerces Java、JAXP。
Xerces Java解析器是完全用Java编写的XML解析器，最新版本是2.5，它支持以下标准和API：
（1） XML1.0规范（第二版本）
（2） XML命名空间规范
（3） DOM2核心标准规范
（4） SAX2核心扩展
（5） JAXP1.2 ：是Sun提供的使用Java处理XML的接口API。
（6） XML Schema结构和数据类型标准
还有最好的是它开放源代码，我们可以在http://xml.apache.org/dist/xerces-j/ 处去下载。下载文件Xerces-J-bin.2.5.0.zip。
解压下载文件，得到四个压缩包加到项目的路径中（其实不要全加，但不熟的情况下考虑这么做）。
JDOM的二进制版本下载：http://www.jdom.org/downloads/index.html
把解压后的jdom.jar文件加到项目的类路径中，另外便于调试，还要下载它的源代码。
三、使用JDOM解析XML
好了，现在该是正题了。下面通过一个简单的例子说明一下怎么用JDOM这一适合Java程序员习惯的工具包来解析XML文档。
为了简单，我用了如下XML作为要解析的XML文件：

<?xml version="1.0" encoding="gb2312"?><books>   <book email="zhoujunhui">     <name>rjzjh</name>     <price>60.0</price>  </book></books>

够简单的吧，但它对于我们关心的东西都有了，子节点，属性。
下面是用于解析这个XML文件的Java文件：

import java.io.FileOutputStream;import java.io.IOException;import java.util.Iterator;import java.util.List;//下面是引用到JDOM中的类import org.jdom.Document;import org.jdom.Element;import org.jdom.JDOMException;import org.jdom.input.SAXBuilder;import org.jdom.output.XMLOutputter;public class JDomParse {2   public JDomParse(){3       String xmlpath="library.xml";                //使用JDOM首先要指定使用什么解析器。如：4       SAXBuilder builder=new SAXBuilder(false);// 这表示使用的是默认的解析器5       try {            //得到Document，我们以后要进行的所有操作都是对这个Document操作的6           Document doc=builder.build(xmlpath);            //在JDOM中所有的节点（DOM中的概念）都是一个org.jdom.Element类，当然他的子节点也是一个org.jdom.Element类。7           Element books=doc.getRootElement();//得到根元素            //这表示得到“books”元素的所在名称为“book”的元素，并把这些元素都放到一个List集合中8           List booklist=books.getChildren("book");//得到元素（节点）的集合            //轮循List集合9           for (Iterator iter = booklist.iterator(); iter.hasNext();) {10              Element book = (Element) iter.next();11              String email=book.getAttributeValue("email");//取得元素的属性12              System.out.println(email);                //注意的是，必须确定book元素的名为“name”的子元素只有一个。13              String name=book.getChildTextTrim("name");//取得元素的子元素（为最低层元素）的值14              System.out.println(name);                // 这只是对Document的修改，并没有在实际的XML文档中进行修改15              book.getChild("name").setText("alterrjzjh");改变元素（为最低层元素）的值16              17          }18          //保存Document的修改到XML文件中            //我们先要有一个XMLOutputter类，再把已经修改了的Document保存进XML文档中。19          XMLOutputter outputter=new XMLOutputter();20          outputter.output(doc,new FileOutputStream(xmlpath));21          22      } catch (JDOMException e) {23          e.printStackTrace();24      } catch (IOException e) {25          e.printStackTrace();26      }27  }28  public static void main(String[] args) {29      new JDomParse();30  }31}

阅读全文

0 0