xml文件解析的几种方式(一)

来源:互联网 发布:ubuntu 传输文件 编辑:程序博客网 时间:2024/05/19 11:47

常见的几种解析xml文件的方式

XML的解析方式有很多,光开源的就有十多种:如XercesJDOMDOM4JXOMJiBXKXMLXMLBeansjConfigXStreamXJR

但是最常用的还是sax,dom,pull,dom4j

而android中用的比较多的是 sax(Simple APIs for XML)、dom(Document Object Model)、pull,其中pull在这三个中又最为适用。(大部分用于java的解析器在android上都可以用,对于有人说dom4j最好,这个没试验过,暂时不好说,但是大部分人都说pull好)

SAX解析

全称:simple  apis for xml ,sax提供的访问模式是一种顺序模式,使用sax解析xml文件时候,会触发一系列事件,调用对应的函数,访问xml,sax接口也称为事件驱动接口  

优点: 采用事件驱动模式,对内存耗费较小,适用只处理xml文件中的数据

缺点:很难同时访问xml文件中的多处不同数据

DOM解析

dom是一种文档对象模型;

优点:dom可以以一种独立于平台和语言的方式访问和修改一个文档的内容和结构,dom技术使得用户页面可以动态的变化,如动态显示隐藏一个元素,改变它的属性,增加一个元素等,dom可以使页面的交互性大大增强。

缺点:dom解析xml文件会将xml文件的所有内容放在内存中

PULL解析

pull和sax很相似,区别在于:pull读取xml文件后触发相应的事件调用方法返回的是数字,且pull可以在程序中控制,想解析到哪里就可以停止解析。 (SAX解析器的工作方式是自动将事件推入事件处理器进行处理,因此你不能控制事件的处理主动结束;而Pull解析器的工作方式为允许你的应用程序代码主动从解析器中获取事件,正因为是主动获取事件,因此可以在满足了需要的条件后不再获取事件,结束解析。pull是一个while循环,随时可以跳出,而sax不是,sax是只要解析了,就必须解析完成。)

选择sax解析还是dom解析

dom解析要求将整个文档全部加载玩,才能执行操作,而且必须存放到内存中,这样可能会内存溢出,之后可以修改文档的结构

而sax解析,不用一次性将文件全部加载完,在找到指定的tag可以停止解析,在处理大型文档时候较好用,而且对内存要求不高

其他的解析方式:

1)DOM4J性能最好,连Sun的JAXM也在用DOM4J.目前许多开源项目中大量采用DOM4J,例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性,那就采用DOM4J.     

2)JDOM和DOM在性能测试时表现不佳,在测试10M文档时内存溢出。在小文档情况下还值得考虑使用DOM和JDOM.虽然JDOM的开发者已经说明他们期望在正式发行版前专注性能问题,但是从性能观点来看,它确实没有值得推荐之处。另外,DOM仍是一个非常好的选择。DOM实现广泛应用于多种编程语言。它还是许多其它与XML相关的标准的基础,因为它正式获得W3C推荐(与基于非标准的Java模型相对),所以在某些类型的项目中可能也需要它(如在JavaScript中使用DOM)。    

3)SAX表现较好,这要依赖于它特定的解析方式-事件驱动。一个SAX检测即将到来的XML流,但并没有载入到内存(当然当XML流被读入时,会有部分文档暂时隐藏在内存中)。