Java之DOM方式解析XML文件

来源：互联网发布：诺基亚n86软件编辑：程序博客网时间：2024/04/29 05:32

XML文件如下（books.xml）：

<?xml version="1.0" encoding="UTF8"?><bookstore><book id="1"><name>冰与火之歌</name><author>乔治马丁</author><year>2014</year><price>89</price></book><book id="2"><name>安徒生童话</name><year>2004</year><price>77</price><language>English</language></book></bookstore>

注意：encoding="UTF-8"会出现XML中1个字节的UTF-8序列的字节1无效，而改为encoding="UTF8"就可以解决。

java程序如下：

package cn.ytu.xml;import java.io.IOException;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import javax.xml.parsers.ParserConfigurationException;import org.w3c.dom.Document;import org.w3c.dom.Element;import org.w3c.dom.NamedNodeMap;import org.w3c.dom.Node;import org.w3c.dom.NodeList;import org.xml.sax.SAXException;public class ReadXml {public static void main(String[] args) {//创建一个DocumentBuilderFactory的对象DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();//创建一个DocumentBuilder的对象try {//创建DocumentBuilder对象DocumentBuilder db = dbf.newDocumentBuilder();//通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下Document document = db.parse("books.xml");//获取所有book节点的集合NodeList bookList = document.getElementsByTagName("book");//通过nodelist的getLength()方法可以获取bookList的长度System.out.println("一共有" + bookList.getLength() + "本书");//遍历每一个book节点for (int i = 0; i < bookList.getLength(); i++) {System.out.println("=================下面开始遍历第" + (i + 1) + "本书的内容=================");//通过 item(i)方法 获取一个book节点，nodelist的索引值从0开始Node book = bookList.item(i);//获取book节点的所有属性集合NamedNodeMap attrs = book.getAttributes();System.out.println("第 " + (i + 1) + "本书共有 :" + attrs.getLength() + "个属性");//遍历book的属性for (int j = 0; j < attrs.getLength(); j++) {//通过item(index)方法获取book节点的某一个属性Node attr = attrs.item(j);//获取属性名System.out.print("属性名：" + attr.getNodeName());//获取属性值System.out.println("--属性值" + attr.getNodeValue());}////前提：已经知道book节点有且只能有1个id属性////将book节点进行强制类型转换，转换成Element类型//Element book = (Element) bookList.item(i);////通过getAttribute("id")方法获取属性值//String attrValue = book.getAttribute("id");//System.out.println("id属性的属性值为" + attrValue);//解析book节点的子节点NodeList childNodes = book.getChildNodes();//遍历childNodes获取每个节点的节点名和节点值System.out.println("第" + (i+1) + "本书共有" + childNodes.getLength() + "个子节点");for (int k = 0; k < childNodes.getLength(); k++) {//区分出text类型的node以及element类型的nodeif (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {//获取了element类型节点的节点名System.out.print("第" + (k + 1) + "个节点的节点名：" + childNodes.item(k).getNodeName());//获取了element类型节点的节点值System.out.println("--节点值是：" + childNodes.item(k).getFirstChild().getNodeValue());//System.out.println("--节点值是：" + childNodes.item(k).getTextContent());}}System.out.println("======================结束遍历第" + (i + 1) + "本书的内容=================");}} catch (ParserConfigurationException e) {e.printStackTrace();}  catch (SAXException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}}}

其中常用的节点类型如下：

运行结果如下：

0 0