XML解析:

来源:互联网 发布:数据治理成熟度模型 编辑:程序博客网 时间:2024/05/16 23:33
 

XML解析:

SAX和DOM解析的比较

在针对XML文档的应用编程接口中,最主要的有W3C制定的DOM(Document Object Method,文档对象模型)和由David Megginson领导的SAX(SimpleAPI for XML,用于XML的简单API)。

SAX和DOM在实现过程中,分别侧重于不同的方面以满足不同的应用需求。DOM为开发基于XML的应用系统提供了便利。它通过一种随机访问机制,使得应用程序利用该接口可以在任何时候访问XML文档中的任何一部分数据,也可以对XML文档中的数据进行插入、删除、修改、移动等操作。在DOM中,文档的逻辑结构类似一棵树。文档、文档中的根、元素、元素内容、属性、属性值等都是以对象模型的形式表示的。DOM的优点在于它在内存中保存文档的整个模型。这使得能以任何顺序访问XML元素。然而,对于大型文档来说,这样做可能不方便。因为它可能会用尽内存,或者当系统达到了它的极限时,机器的性能将

会慢下来。

SAX提供了一种对XML文档进行顺序访问的模式,这是一种快速读XML数据的方式。SAX接口是事件驱动的,当使用SAX分析器对XML文档进行分析时,就会触发一系列事件,并激活相应的事件处理函数,从而完成对XML文档的访问。SAX处理XML的方式与DOM不同。SAX解析器不是将DOM树解析和表现为输出,它是基于事件的,所以在XML被解析时,事件被发送给引擎。SAX可以在文档的开始接收事件,也可以接收文档中的元素。使用这些事件可以构建一种结构。因为SAX没有把XML文档完全地加载到内存中,所以需要的系统资源较少,是一个分析XML文档的高效API。缺点是编写SAX比编写DOM复杂,这因为首先必须实现通知接口并维护状态,其次SAX不允许对文档进行随机访问,也没有提供像DOM那大型样的修改功能。

比较而言,DOM和SAX各有自己的应用场合。DOM适用于处理下面的问题:解析比较小的XML文件;需要对文档进行修改;需要随机对文档进行访问。SAX适于处理下面的问题:对大型文档进行处理;只需要文档的部分内容;只需要从文档中得到特定信息。

Dom

Document Object  Model 文档对象模型,由W3C制定 标准规范 与具体语言无关 随机访问XML文档 重复读  

DOM的编程API:

Node:节点

Document :根节点 表示整个文档 

NodeList:节点的集合 

NamedNodeMap:一般用于存储属性 

Element:

Text

Attr

编程思路:

1.获得DocumentBuilderFactory的实例

2.

通过工厂获得DocumentBuilder的解析器

3.parse(File)======>Document

//通过DOM方式解析XML文档

public class MyDom{

public static void main(String args[])throws Exception{

//1.得到工厂类(DocumentBuilderFactory)的实例

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

//2.得到解析器实例

DocumentBuilder builder=factory.newDocumentBuilder();

//3.使用parse()解析文件 返回 文档的根节点 Document

Document  doc=builder.parse(new File("student.xml"));

Element  root=doc.getDocumentElement();

System.out.println("根元素是:"+root.getTagName());

NodeList  nl=doc.getElementsByTagName("student");

//NodeList nl=root.getChildNodes();

//遍历NodeList

for(int i=0;i<nl.getLength();i++){

Node node=nl.item(i); //得到Node集合中的每一个

NamedNodeMap nnm=node.getAttributes();

for(int j=0;j<nnm.getLength();j++){

Node att_node=nnm.item(j);

Attr  attr=(Attr)att_node;

String att_name=attr.getName();

String att_value=attr.getValue();

System.out.println(att_name+"="+att_value);

}

Element first=(Element)node;

System.out.println(first.getTagName());

//得到每个student元素的子节点

NodeList secs=node.getChildNodes();

System.out.println(secs.getLength());

for(int k=0;k<secs.getLength();k++){

//得到二级子节点

Node sec_node=secs.item(k);

//过滤空白

if(sec_node.getNodeType()==Node.ELEMENT_NODE){

Element sec=(Element)sec_node;

System.out.println(sec.getTagName());

System.out.println(sec.getTextContent());

}

}

}

}

}

public class MyDom2{

public static void main(String args[])throws Exception{

DocumentBuilder builder=DocumentBuilderFactory.newInstance().newDocumentBuilder();

Document doc=builder.parse(new File("student.xml"));

NodeList firsts=doc.getElementsByTagName("student");

//遍历一级子元素过程

for(int i=0;i<firsts.getLength();i++){

Element first=(Element)firsts.item(i);//student

String id_value=first.getAttribute("id");

String name=first.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();

String age=first.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();

String address=first.getElementsByTagName("address").item(0).getFirstChild().getNodeValue();

System.out.println("id is:"+id_value+"\t"+name+"\t"+age+"\t"+address);

//  getChildNodes()

//NodeList first.getChildNodes();

}

}

}

原创粉丝点击