XML-4

来源:互联网 发布:mysql 数据表迁移 编辑:程序博客网 时间:2024/06/06 12:43

SAXDOM解析的比较

在针对XML文档的应用编程接口中,最主要的有W3C制定的DOM(Document Object Method,文档对象模型)和由David Megginson领导的SAX(SimpleAPI for XML,用于XML的简单API)。

SAX和DOM在实现过程中,分别侧重于不同的方面以满足不同的应用需求。DOM为开发基于XML的应用系统提供了便利。它通过一种随机访问机制,使得应用程序利用该接口可以在任何时候访问XML文档中的任何一部分数据,也可以对XML文档中的数据进行插入、删除、修改、移动等操作。在DOM中,文档的逻辑结构类似一棵树。文档、文档中的根、元素、元素内容、属性、属性值等都是以对象模型的形式表示的。DOM的优点在于它在内存中保存文档的整个模型。这使得能以任何顺序访问XML元素。然而,对于大型文档来说,这样做可能不方便。因为它可能会用尽内存,或者当系统达到了它的极限时,机器的性能将会慢下来。

SAX提供了一种对XML文档进行顺序访问的模式,这是一种快速读XML数据的方式。SAX接口是事件驱动的,当使用SAX分析器对XML文档进行分析时,就会触发一系列事件,并激活相应的事件处理函数,从而完成对XML文档的访问。SAX处理XML的方式与DOM不同。SAX解析器不是将DOM树解析和表现为输出,它是基于事件的,所以在XML被解析时,事件被发送给引擎。SAX可以在文档的开始接收事件,也可以接收文档中的元素。使用这些事件可以构建一种结构。因为SAX没有把XML文档完全地加载到内存中,所以需要的系统资源较少,是一个分析大型XML文档的高效API。缺点是编写SAX比编写DOM复杂,这因为首先必须实现通知接口并维护状态,其次SAX不允许对文档进行随机访问,也没有提供像DOM那样的修改功能。

比较而言,DOM和SAX各有自己的应用场合。DOM适用于处理下面的问题:解析比较小的XML文件;需要对文档进行修改;需要随机对文档进行访问。SAX适于处理下面的问题:对大型文档进行处理;只需要文档的部分内容;只需要从文档中得到特定信息。

DOM:

Document Object  Model 文档对象模型,由W3C制定 标准规范 与具体语言无关 随机访问XML文档 重复读  

DOM的编程API:

Node:节点

Document :根节点 表示整个文档 

NodeList:节点的集合 

NamedNodeMap:一般用于存储属性 

Element:

编程思路:

1.获得DocumentBuilderFactory的实例

2.通过工厂获得DocumentBuilder的解析器

3.parse(File)======>Document

SAX:

Simple Api  for XML xml简单处理API),提供了一种基于事件的XML的解析方式 

多用于快速读取XML文档

基于事件驱动,在内存中并不会加载整个文档,效率要高(解析大型XML文档)

不能重复读取  顺序读取模式

1.得到工厂实例

SAXParserFactory actory=SAXParserFactory.newInstance();

2.由工厂实例 得到 解析器

SAXParser parser=factory.newSAXParser();

3.解析器  parse (File f,MyHandler extends DefaultHandler dh)

Class MyHandler extends DefaultHandler{

public void 

}