xml文档的解析

来源：互联网发布：金融网络销售干什么的编辑：程序博客网时间：2024/04/27 14:56

Element 元素节点；Text 文本节点；Attr 属性节点
Node节点类型定义了作为节点的共性。getNodeName() getNodeType() getNodeValue()
文档对象，只有一个儿子，根节点

编写java程序完成xml文档的解析
DOM解析器
在 javax.xml.parsers 包中，定义了几个工厂类，程序员调用这些工厂类，可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。
DocumentBuilder的对象是dom解析器，通过对应的工厂类创建
SAXParser的对象是sax解析器，通过对应的工厂类创建。

sax的工作流程，以下面的book.xml为例（不做dtd定义的验证，如果有这方面需求，可以查更详细的文档）。
<?xml version="1.0"?>
<books>
       <book type="computer">
              <title>java 2</title>
              <page>600</page>
              <author>Jim</author>
       </book>
              <book type="fiction">
              <title>fly to moon</title>
              <page>300</page>
              <author>Vernia</author>
       </book>
</books>

1.我们需要注册一个实现了sax标准的解析器，sun,java,apache等厂商和组织都实现了自己的解析器，大家可以直接拿过来用。
2.然后告诉解析器，我们会用哪个xml解析程序来处理xml文档。这个解析程序是由我们自己来实现的。
3在解析开始时，解析器会触发解析程序的startDocument()方法，告诉应用程序，文档解析开始了。

要注意以下几点：
1.区分解析器，解析程序的概念。
2.sax实现是事件驱动的，由解析器触发应用程序，而不是由应用程序来调用解析器。这和ui里的Actionlistener实现差不多。
3.startDocument()方法是由ContentHandler接口定义的，我们必须要实现他。xml解析程序就是用来实现这些方法的。为什么要这么做？因为sax不会定义在接收到方法触发后，会采取什么动作。只有我们自己才知道在解析的过程中，我们会做什么。不明白没有关系，再往下看。
4.当遇到<books>后，解析器会触发解析程序的startElement()方法，告诉应用程序，我遇到一个开始的标签。这个startElement()方法也是由ContentHandler接口定义的，他只是提醒应用程序他遇到一个标签的开始，至于是什么标签，他不知道，也不想知道。而由xml解析程序实现了的startElement()方法，功能就大了。比如我们可以判断这个标签的内容是什么，如果是books，好，正是我们需要的，要记到内存里；如果不是，放弃，继续往下走。
5.过了<books>后，解析器会触发解析程序的characters()方法，告诉应用程序，我遇到了标签的内容。同样的原理，由xml解析程序实现了的characters()方法会处理这个内容。当然了如果是我们需要的，就留下；如果不是就放弃。在这个例子里，<books>后面是空格，没有实际价值。
6.再往下遇到了<book type="computer">标签，同样触发的是startElement()方法。以此类推，在标签结束时，会触发endElement()方法，在文档结束时会触发endDocument()方法。至于每次触发一个方法后，产生什么动作，都是由我们的解析程序来控制的。

 1调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。
DocumentBuilderFactory factory= DocumentBuilderFactory.newInstance()；
 2调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。
DocumentBuilder db=factory.newDocumentBuilder();
 3调用 DOM 解析器对象的 parse() 方法解析 XML 文档，得到代表整个文档的 Document 对象，进行可以利用DOM特性对整个XML文档进行操作了。通过parse()装载一个xml文档。