java与xml之SAX解析XML文档
来源:互联网 发布:java string contact 编辑:程序博客网 时间:2024/05/24 02:15
SAX处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时停止解析。一般来说,SAX还比它的替代者DOM快许多。
选择DOM还是选择SAX? 对于需要自己编写代码来处理XML文档的开发人员来说, 选择DOM还是SAX解析模型是一个非常重要的设计决策。
DOM采用建立树形结构的方式访问XML文档,而SAX采用的事件模型。
DOM解析器把XML文档转化为一个包含其内容的树,并可以对树进行遍历。用DOM解析模型的优点是编程容易,开发人员只需要调用建树的指令,然后利用
navigation
APIs访问所需的树节点来完成任务。可以很容易的添加和修改树中的元素。然而由于使用DOM解析器的时候需要处理整个XML文档,所以对性能和内存的要求比较高,尤其是遇到很大的XML文件的时候。由于它的遍历能力,DOM解析器常用于XML文档需要频繁的改变的服务中。
SAX解析器采用了基于事件的模型,它在解析XML文档的时候可以触发一系列的事件,当发现给定的tag的时候,它可以激活一个回调方法,告诉该方法制定的标签已经找到。SAX对内存的要求通常会比较低,因为它让开发人员自己来决定所要处理的tag.特别是当开发人员只需要处理文档中所包含的部分数据时,SAX这种扩展能力得到了更好的体现。但用SAX解析器的时候编码工作会比较困难,而且很难同时访问同一个文档中的多处不同数据。
优点:不用事先调入整个文档,占用资源少;SAX解析器代码比DOM解析器代码小,适于Applet,下载
缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;使用场合:Applet;只需XML文档的少量内容,很少回头访问;机器内存少;
这里,我们准备一个xml文档,内容及结构如下:
- <?xml version="1.0" encoding="utf-8" standalone="no"?>
- <books>
- <book id="1">
- <name></name>
- <price>50</price>
- <author>作者0</author>
- </book>
- <book id="2">
- <name>书本1</name>
- <price>100</price>
- <author>作者1</author>
- </book>
- <book id="3">
- <name>书本2</name>
- <price>150</price>
- <author>作者2</author>
- </book>
- </books>
解析代码如下:
- package com.mdy.xml.xmldemo;
-
- import java.io.FileInputStream;
- import java.io.FileNotFoundException;
- import java.io.IOException;
-
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
-
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.helpers.DefaultHandler;
-
- public class SAXDemo{
-
- public SAXDemo() {
- super();
- }
-
- public static void main(String[] args) {
- SAXDemo saxDemo = new SAXDemo();
- saxDemo.parserXML("SAXDemo.xml");
- }
-
-
- public void parserXML(String fileName) {
- SAXParserFactory saxFactory = SAXParserFactory.newInstance();
- try {
- SAXParser saxParse = saxFactory.newSAXParser();
- saxParse.parse(new FileInputStream(fileName), new MySAXHandle());
- } catch (ParserConfigurationException e) {
- e.printStackTrace();
- } catch (SAXException e) {
- e.printStackTrace();
- } catch (FileNotFoundException e) {
- e.printStackTrace();
- } catch (IOException e) {
- e.printStackTrace();
- }
- }
-
- class MySAXHandle extends DefaultHandler {
-
- private String preTag;
- @Override
- public void startDocument() throws SAXException {
- System.out.println("开始解析文档------");
- }
-
- @Override
- public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException {
- if("books".equals(qName)){
- System.out.println("打印根节点:"+qName);
- }else{
- System.out.print(qName);
- }
- preTag = qName;
- for(int i=0;i<attributes.getLength();i++){
- System.out.println("属性:"+attributes.getQName(i)+"---> 值:"+attributes.getValue(i));
- }
- }
-
- @Override
- public void endElement(String uri, String localName, String qName)throws SAXException {
-
- preTag = null;
-
- }
-
- @Override
- public void characters(char ch[], int start, int length)throws SAXException {
- if(preTag != null){
- String content = new String(ch, start, length);
- if(content != null && !"".equals(content.replace("\r\n", "").trim())){
- System.out.println(":"+content);
- }
- }
- }
-
- @Override
- public void endDocument() throws SAXException {
- System.out.println("结束解析文档------");
- }
-
- }
-
-
- }
运行结果:
- 开始解析文档------
- 打印根节点:books
- book属性:id---> 值:1
- nameprice:50
- author:作者0
- book属性:id---> 值:2
- name:书本1
- price:100
- author:作者1
- book属性:id---> 值:3
- name:书本2
- price:150
- author:作者2
- 结束解析文档------