SAX PULL DOCUMENT解析XML总结

来源:互联网 发布:手机淘宝2013版 编辑:程序博客网 时间:2024/05/01 11:23

SAX解析

1.继承DefaultHandler类,重写startDocument、startElement、character、endElement、endDocument方法,startDocument在读取<?xml version="1.0" encoding="UTF-8"?>时调用,可写一些实例化列表等;startElement在读取每个标签时调用,通过判断历史标签需要是否为需要获取的值的头;characters用来读取标签中的值;endElement读取标签的结束,用来保存characters获取的值;endDocument一般不做处理。

2.用SAXParser或者XMLReader来解析

SAXParser解析:

SAXHandlerParseService saxForHandler = new SAXHandlerParseService();SAXParserFactory spf = SAXParserFactory.newInstance();SAXParser saxParse = spf.newSAXParser();saxParse.parse(input, saxForHandler);List<Map<String, Object>> userList = saxForHandler.getUser();

XMLReader解析:

SAXHandlerParseService saxForHandler = new SAXHandlerParseService();SAXParserFactory spf = SAXParserFactory.newInstance();SAXParser saxParse = spf.newSAXParser();// 为xmlReader设置内容处理器XMLReader reader = saxParse.getXMLReader();reader.setContentHandler(saxForHandler);// 开始赋值reader.parse(new InputSource(new StringReader(xml)));List<Map<String, Object>> userList = saxForHandler.getUser();

在解析时,一定要小心,不要忽略空白的地方,Sax解析器会把它认为是一个TextNod


PULL解析

与SAX类似,同样有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT。实例化XmlPullParser解析器,设置输入编码(setInput),获得事件类型(getEventType),用SAX相同的处理进行,next()方法往下继续读取


DOCUMENT解析
1.实例化DocumentBuilderFactory

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();DocumentBuilder builder = factory.newDocumentBuilder();Document document = builder.parse(input);Element root = document.getDocumentElement();

2.跟xml传入的数据结构进行处理

3.返回需要的列表值即可


三者区别

DOM:
解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)

SAX/PULL:
事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少
缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;
使用场合:只需XML文档的少量内容,很少回头访问;一次性读取;机器内存少;

注意:SAX 解析器不创建任何对象。

工程下载地址 (包括该文项目)

0 0
原创粉丝点击