sax与Dom区别

来源:互联网 发布:面试算法题 编辑:程序博客网 时间:2024/06/04 18:42
SAX与DOM的比较 

每一个进行XML开发的编程人员都知道DOM,那为什么在有了DOM这个功能强大的文档对象模型之后,我们还需要SAX?这就要从它们根本不同的实现方法上来分析。DOM解析器是通过将XML文档解析成树状模型并将其放入内存来完成解析工作的,而后对文档的操作都是在这个树状模型上完成的。这个在内存中的文档树将是文档实际大小的几倍。这样做的好处是结构清除、操作方便,而带来的麻烦就是极其耗费系统资源。而SAX正好克服了DOM的缺点。SAX解析器的处理过程是通读整个文档,根据文档内容产生事件,而把对这些事件的处理交由事件处理器处理。SAX不需要在内存中保存整个文档,它对系统资源的节省是显而易见的。这样在一些需要处理大型XML文档和性能要求比较高的场合就要用SAX了。 

下面的表格列出了SAX和DOM在一些方面的对照: 
SAXDOM顺序读入文档并产生相应事件,可以处理任何大小的XML文档在内存中创建文档树,不适于处理大型XML文档。只能对文档按顺序解析一遍,不支持对文档的随意访问。可以随意访问文档树的任何部分,没有次数限制。只能读取XML文档内容,而不能修改可以随意修改文档树,从而修改XML文档。开发上比较复杂,需要自己来实现事件处理器。易于理解,易于开发。对开发人员而言更灵活,可以用SAX创建自己的XML对象模型。已经在DOM基础之上创建好了文档树。
通过对SAX和DOM的分析,它们各有自己的不同应用领域: 

    SAX适于处理下面的问题: 
    对大型文档进行处理。 
    只需要文档的部分内容,或者只需要从文档中得到特定信息。 
    想创建自己的对象模型的时候。 

DOM适于处理下面的问题: 

    需要对文档进行修改 
    需要随机对文档进行访问,例如XSLT解析器。 

一些值得注意的问题 

首先是有关元素内容的问题,在SAX API定义中元素内容可以在一次事件(由characters()方法处理)中返回,也可以在多次事件中返回,这样我们就应该考虑不能一次得到所有内容数据的情况。一般的解决办法是定义一个StringBuffer由它来保存内容数据,在元素结束或者新元素开始的时候清空这个StringBuffer从而可以保存新的内容数据。请参考上面的相应的源代码。 

还有在SAX API中特意提到从 characters(char[] ch,int start,int length)方法中提取数据时一定不要从返回的字符数组范围之外读取,这一点我们也要切记。 

另一个值得注意的问题是,在 startElement()方法中返回的Attributes属性列表中的属性顺序并没有被特意规定,在不同的SAX实现中也各不相同。所以我们在编写程序时不要把属性顺序想成一定的。 

使用过滤器 

在SAX API中还提供了一个过滤器接口org.xml.sax.XMLFilter,以及对它的缺省实现org.xml.sax.helper.XMLFilterImpl。使用它们可以很容易的开发出复杂的SAX应用。这里要先介绍一下过滤器设计模式。这个设计模式很好理解,就像一个净化水的过程。自然界中的水流过一个个的过滤器得到最后的饮用水。这些过滤器,有的是清除水中的泥沙,有的是杀灭水中的细菌,总之不同的过滤器完成不同的任务。在应用开发中,我们让被改造的对象(这里是事件流)通过这些过滤器对象从而得到改造后符合要求的对象。这样,在过滤器的帮助之下,我们可以非常方便的在每个过滤器中实现一个特定功能,从而创建结构复杂的应用程序。在应用程序中你可以构造任意多个过滤器,将它们串接起来完成任务。 

在SAX API中org.xml.sax.XMLFilter接口继承了org.xml.sax.XMLReader接口。它与XMLReader不同的是它不像XMLReader那样通过解析文档来获取事件,而是从其他XMLReader中获取事件,当然这也包括从其他的XMLFilter中获取事件。 

XmlFilter是一个非常好用的方法,以后在工作中尽量使用。下面是我实现的例子: 

package test.corejava.xml;import java.io.IOException;import javax.xml.parsers.ParserConfigurationException;import org.xml.sax.InputSource;import org.xml.sax.SAXException;import org.xml.sax.XMLFilter;import org.xml.sax.XMLReader;import org.xml.sax.helpers.DefaultHandler;import org.xml.sax.helpers.XMLReaderFactory;public class MySAXApp {public static void main(String[] args) throws ParserConfigurationException {try {// 初始化readerXMLReader reader = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser");// 初始化过滤器XMLFilter myFilter = new MyFilter(reader);// 创建DefaultHandler的实例//DefaultHandler defaultHandler = new MyDefaultHandler();XMLFilter myFilter2 = new MyFilter2(myFilter);// 为过滤后的事件流设置ContentHandlermyFilter2.setContentHandler(new DefaultHandler());// 为过滤后的事件流设置ErrorHandlermyFilter2.setErrorHandler(new DefaultHandler());// 开始解析文档myFilter2.parse(new InputSource(MySAXApp.class.getResourceAsStream("book.xml")));} catch (IOException e) {System.out.println("读入文档时错: " + e.getMessage());} catch (SAXException e) {System.out.println("解析文档时错: " + e.getMessage());}}}

可以利用Filter去取自己想要的元素! 
原文链接地址:http://shellfj.iteye.com/blog/1084620


0 0