XML文件的解析

来源：互联网发布：淘宝代码是什么意思编辑：程序博客网时间：2024/05/08 18:44

XML文件的解析

xml是为了提高web数据交换量而出现的，虽然他现在web应用中并不广泛，但是由于他的格式良好，经常被用做配置文件的格式。比如tomcat的主配置文件server.xml，web.xml等等。

对xml进行解析的标准有两种，sax以及dom。

Dom：

首先这两种标准并不是针对java的，他们在各种语言环境下都可以实现。

dom：(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式，dom是真正的国际标准。

dom实现的原理是把整个xml文档一次性读出，放在一个树型结构里。在需要的时候，查找特定节点，然后对节点进行读或写。他的主要优势是实现简单，读写平衡；缺点是比较占内存，因为他要把整个xml文档都读入内存，文件越大，这种缺点就越明显。

Sax：

sax：(Simple API for XML) 不是官方标准，是事实的标准，几乎所有的 XML 解析器都支持它。他不由任何商业组织维护，而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样，虽然sax不是正式的标准，但是一点不影响他在xml解析领域的地位。

sax的实现方法和dom不同。他只在xml文档中查找特定条件的内容，并且只提取需要的内容。这样做占用内存小，灵活，正好满足我们的需求。他的缺点就是写，有些资料介绍了写入的方法，但是我感觉这对本例没有必要。后面主要讲解用sax2.0实现xml文档解析。

开发工具：

解析器：Crimson（SUN）、Xerces（Apache）、Aelfred2（dom4j）

开发工具包：Jaxp、Jdom、dom4j

JAXP 开发包是J2SE的一部分，它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成。JAXP相当于jdbc

编写java程序完成xml文档的解析

DOM解析器的简单应用：

在 javax.xml.parsers 包中，定义了几个工厂类，程序员调用这些工厂类，可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。

DocumentBuilder的对象是dom解析器，通过对应的工厂类创建

SAXParser的对象是sax解析器，通过对应的工厂类创建。

创建dom的解析器，来解析xml文档。

DocumentBuilderFactory用于创建DOM模式的解析器对象， DocumentBuilderFactory是一个抽象工厂类，它不能直接实例化，但该类提供了一个newInstance方法，这个方法会根据本地平台默认安装的解析器，自动创建一个工厂的对象并返回。

 调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。

DocumentBuilderFactory factory= DocumentBuilderFactory.newInstance()；

 调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。

DocumentBuilder db=factory.newDocumentBuilder();

 调用 DOM 解析器对象的 parse() 方法解析 XML 文档，得到代表整个文档的 Document 对象，进行可以利用DOM特性对整个XML文档进行操作了。通过parse()装载一个xml文档。

Document doc=db.parse(DemoTest.class.getClassLoader().getResourceAsStream(“book.xml”));

或者直接db.parse(new File(src/book.xml));

接下来就要介绍文档对象模型dom了。

Xml文档它里面所有的内容都会被当成Node类型来处理。

Node的节点类型：

Element元素节点、Text文本节点、Attr属性节点、

Node节点类型定义了作为节点的共性：

getNodeName() //获取节点名字

getNodeType() //获取节点类型

getNodeValue() //获取节点内容

使用dom对xml文件进行简单解析实例：

package cn.csdn.dom;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;

import org.w3c.dom.NamedNodeMap;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

public class BookTest {

public static void main(String[] args) throws Exception {

//(1) 生成工厂类的对象

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

//(2) 生成解析对象

DocumentBuilder db = factory.newDocumentBuilder();

// （3）对文档进行解析

Document doc = db.parse(new File("src/book.xml"));

Node node = doc.getChildNodes().item(0);

findAttributes(node);

findChilderen(doc);

findElementChilderen(doc);

}

// 遍历属性节点

public static void findAttributes(Node node) {

NamedNodeMap map = node.getAttributes();

int count = 0;

if (map != null) {

for (int i = 0; i < map.getLength(); i++) {

Node n = map.item(i);

System.out.println(n.getNodeName() + " " + n.getNodeType()

+ " " + n.getNodeValue());

count++;

}

System.out.println("遍历属性节点个数：" + count);

System.out.println();

}

//遍历所有的子节点

public static void findChilderen(Node node) {

// 先通过文档对象node得到根节点对象

Node root = node.getChildNodes().item(0);

// 通过根节点root对象得到根节点所有的儿子节点，返回一个节点的集合

NodeList list = root.getChildNodes();

int count = 0;

for (int i = 0; i < list.getLength(); i++) {

Node n = list.item(i);

System.out.println(n.getNodeName() + " " + n.getNodeType() + " "

+ n.getNodeValue());

count++;

}

System.out.println("遍历子数 :" + count);

System.out.println();

}

// 遍历元素节点

public static void findElementChilderen(Node node) {

// 先通过文档对象node得到根节点对象

Node root = node.getChildNodes().item(0);

// 通过根节点root对象得到根节点所有的儿子节点，返回一个节点的集合

NodeList list = root.getChildNodes();

int count = 0;

for (int i = 0; i < list.getLength(); i++) {

Node n = list.item(i);

if (n.getNodeType() == Node.ELEMENT_NODE) {

System.out.println(n.getNodeName() + " " + n.getNodeType()

+ " " + n.getNodeValue());

count++;

}

System.out.println("元素节点的总数" + count);

System.out.println();

}