XML解析：

来源：互联网发布：数据治理成熟度模型编辑：程序博客网时间：2024/05/16 23:33

XML解析：

SAX和DOM解析的比较

在针对XML文档的应用编程接口中，最主要的有W3C制定的DOM(Document Object Method，文档对象模型)和由David Megginson领导的SAX(SimpleAPI for XML，用于XML的简单API)。

SAX和DOM在实现过程中，分别侧重于不同的方面以满足不同的应用需求。DOM为开发基于XML的应用系统提供了便利。它通过一种随机访问机制，使得应用程序利用该接口可以在任何时候访问XML文档中的任何一部分数据，也可以对XML文档中的数据进行插入、删除、修改、移动等操作。在DOM中，文档的逻辑结构类似一棵树。文档、文档中的根、元素、元素内容、属性、属性值等都是以对象模型的形式表示的。DOM的优点在于它在内存中保存文档的整个模型。这使得能以任何顺序访问XML元素。然而，对于大型文档来说，这样做可能不方便。因为它可能会用尽内存，或者当系统达到了它的极限时，机器的性能将

会慢下来。

SAX提供了一种对XML文档进行顺序访问的模式，这是一种快速读XML数据的方式。SAX接口是事件驱动的，当使用SAX分析器对XML文档进行分析时，就会触发一系列事件，并激活相应的事件处理函数，从而完成对XML文档的访问。SAX处理XML的方式与DOM不同。SAX解析器不是将DOM树解析和表现为输出，它是基于事件的，所以在XML被解析时，事件被发送给引擎。SAX可以在文档的开始接收事件，也可以接收文档中的元素。使用这些事件可以构建一种结构。因为SAX没有把XML文档完全地加载到内存中，所以需要的系统资源较少，是一个分析XML文档的高效API。缺点是编写SAX比编写DOM复杂，这因为首先必须实现通知接口并维护状态，其次SAX不允许对文档进行随机访问，也没有提供像DOM那大型样的修改功能。

比较而言，DOM和SAX各有自己的应用场合。DOM适用于处理下面的问题：解析比较小的XML文件；需要对文档进行修改；需要随机对文档进行访问。SAX适于处理下面的问题：对大型文档进行处理；只需要文档的部分内容；只需要从文档中得到特定信息。

Dom

Document Object Model 文档对象模型，由W3C制定标准规范与具体语言无关随机访问XML文档重复读

DOM的编程API：

Node:节点

Document :根节点表示整个文档

NodeList:节点的集合

NamedNodeMap:一般用于存储属性

Element:

Text

Attr

编程思路:

1.获得DocumentBuilderFactory的实例

通过工厂获得DocumentBuilder的解析器

3.parse(File)======>Document

//通过DOM方式解析XML文档

public class MyDom{

public static void main(String args[])throws Exception{

//1.得到工厂类（DocumentBuilderFactory）的实例

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

//2.得到解析器实例

DocumentBuilder builder=factory.newDocumentBuilder();

//3.使用parse（）解析文件返回文档的根节点 Document

Document doc=builder.parse(new File("student.xml"));

Element root=doc.getDocumentElement();

System.out.println("根元素是："+root.getTagName());

NodeList nl=doc.getElementsByTagName("student");

//NodeList nl=root.getChildNodes();

//遍历NodeList

for(int i=0;i<nl.getLength();i++){

Node node=nl.item(i); //得到Node集合中的每一个

NamedNodeMap nnm=node.getAttributes();

for(int j=0;j<nnm.getLength();j++){

Node att_node=nnm.item(j);

Attr attr=(Attr)att_node;

String att_name=attr.getName();

String att_value=attr.getValue();

System.out.println(att_name+"="+att_value);

}

Element first=(Element)node;

System.out.println(first.getTagName());

//得到每个student元素的子节点

NodeList secs=node.getChildNodes();

System.out.println(secs.getLength());

for(int k=0;k<secs.getLength();k++){

//得到二级子节点

Node sec_node=secs.item(k);

//过滤空白

if(sec_node.getNodeType()==Node.ELEMENT_NODE){

Element sec=(Element)sec_node;

System.out.println(sec.getTagName());

System.out.println(sec.getTextContent());

}

public class MyDom2{

public static void main(String args[])throws Exception{

DocumentBuilder builder=DocumentBuilderFactory.newInstance().newDocumentBuilder();

Document doc=builder.parse(new File("student.xml"));

NodeList firsts=doc.getElementsByTagName("student");

//遍历一级子元素过程

for(int i=0;i<firsts.getLength();i++){

Element first=(Element)firsts.item(i);//student

String id_value=first.getAttribute("id");

String name=first.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();

String age=first.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();

String address=first.getElementsByTagName("address").item(0).getFirstChild().getNodeValue();

System.out.println("id is:"+id_value+"\t"+name+"\t"+age+"\t"+address);

// getChildNodes()

//NodeList first.getChildNodes();

}