XML文件的解析
来源:互联网 发布:淘宝代码是什么意思 编辑:程序博客网 时间:2024/05/08 18:44
XML文件的解析
xml是为了提高web数据交换量而出现的,虽然他现在web应用中并不广泛,但是由于他的格式良好,经常被用做配置文件的格式。比如tomcat的主配置文件server.xml,web.xml等等。
对xml进行解析的标准有两种,sax以及dom。
Dom:
首先这两种标准并不是针对java的,他们在各种语言环境下都可以实现。
dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式,dom是真正的国际标准。
dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。他的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。
Sax:
sax:(Simple API for XML) 不是官方标准,是事实的标准,几乎所有的 XML 解析器都支持它。他不由任何商业组织维护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响他在xml解析领域的地位。
sax的实现方法和dom不同。他只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。他的缺点就是写,有些资料介绍了写入的方法,但是我感觉这对本例没有必要。后面主要讲解用sax2.0实现xml文档解析。
开发工具:
解析器:Crimson(SUN)、Xerces(Apache) 、Aelfred2(dom4j)
开发工具包:Jaxp、Jdom、dom4j
JAXP 开发包是J2SE的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成。JAXP相当于jdbc
编写java程序完成xml文档的解析
DOM解析器的简单应用:
在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。
DocumentBuilder的对象是dom解析器,通过对应的工厂类创建
SAXParser的对象是sax解析器,通过对应的工厂类创建。
创建dom的解析器,来解析xml文档。
DocumentBuilderFactory用于创建DOM模式的解析器对象 , DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。
调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。
DocumentBuilderFactory factory= DocumentBuilderFactory.newInstance();
调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。
DocumentBuilder db=factory.newDocumentBuilder();
调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。通过parse()装载一个xml文档。
Document doc=db.parse(DemoTest.class.getClassLoader().getResourceAsStream(“book.xml”));
或者直接db.parse(new File(src/book.xml));
接下来就要介绍文档对象模型dom了。
Xml文档它里面所有的内容都会被当成Node类型来处理。
Node的节点类型:
Element元素节点、Text文本节点、Attr属性节点、
Node节点类型定义了作为节点的共性:
getNodeName() //获取节点名字
getNodeType() //获取节点类型
getNodeValue() //获取节点内容
使用dom对xml文件进行简单解析实例:
package cn.csdn.dom;
import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
public class BookTest {
public static void main(String[] args) throws Exception {
//(1) 生成工厂类的对象
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//(2) 生成解析对象
DocumentBuilder db = factory.newDocumentBuilder();
// (3)对文档进行解析
Document doc = db.parse(new File("src/book.xml"));
Node node = doc.getChildNodes().item(0);
findAttributes(node);
findChilderen(doc);
findElementChilderen(doc);
}
// 遍历属性节点
public static void findAttributes(Node node) {
NamedNodeMap map = node.getAttributes();
int count = 0;
if (map != null) {
for (int i = 0; i < map.getLength(); i++) {
Node n = map.item(i);
System.out.println(n.getNodeName() + " " + n.getNodeType()
+ " " + n.getNodeValue());
count++;
}
}
System.out.println("遍历属性节点个数:" + count);
System.out.println();
}
//遍历所有的子节点
public static void findChilderen(Node node) {
// 先通过文档对象node得到根节点对象
Node root = node.getChildNodes().item(0);
// 通过根节点root对象得到根节点所有的儿子节点,返回一个节点的集合
NodeList list = root.getChildNodes();
int count = 0;
for (int i = 0; i < list.getLength(); i++) {
Node n = list.item(i);
System.out.println(n.getNodeName() + " " + n.getNodeType() + " "
+ n.getNodeValue());
count++;
}
System.out.println("遍历子数 :" + count);
System.out.println();
}
// 遍历元素节点
public static void findElementChilderen(Node node) {
// 先通过文档对象node得到根节点对象
Node root = node.getChildNodes().item(0);
// 通过根节点root对象得到根节点所有的儿子节点,返回一个节点的集合
NodeList list = root.getChildNodes();
int count = 0;
for (int i = 0; i < list.getLength(); i++) {
Node n = list.item(i);
if (n.getNodeType() == Node.ELEMENT_NODE) {
System.out.println(n.getNodeName() + " " + n.getNodeType()
+ " " + n.getNodeValue());
count++;
}
}
System.out.println("元素节点的总数" + count);
System.out.println();
}
}
- xml文件的解析
- XML文件的解析
- XML文件的解析
- xml文件的解析
- xml文件的解析
- XML文件的解析
- XML文件的解析
- XML文件的解析
- xml文件的解析
- xml文件的解析
- XML文件的解析
- xml文件的解析
- XML 文件的解析
- XML文件的解析
- xml文件的解析
- xml文件的解析
- XML文件的解析
- xml文件的sax解析
- 六大设计原则
- Android复制粘贴到剪贴板
- 深入浅出MS06-040(2)
- c6中实现用款统计信息查询的思路
- linux配置java环境变量(详细)
- XML文件的解析
- POJ 2057 The Lost House 树状DP
- Android获取屏幕尺寸
- nextwhy最后的挣扎
- 区别python 的str和repr
- 在校大学生 linux 软件动手项目精选(一) linux 下 hard disk 文件快速搜索工具 HDD_Search
- 深入浅出MS06-040(3)
- 深入浅出MS06-040(4)
- 深入浅出MS06-040(5)