web day6 DOM＆XML(JAXP的SAX解析XML,schema入门,dom4j＆XPath的增删改查)

来源：互联网发布：蚁群算法核心问题编辑：程序博客网时间：2024/06/05 21:13

思维导图

1、schema约束

dtd语法： <!ELEMENT 元素名称约束>

**schema符合xml的语法，xml语句

**一个xml中可以有多个schema，多个schema使用名称空间区分（类似于java包名）

**dtd里面有PCDATA类型，但是在schema里面可以支持更多的数据类型

***比如年龄只能是整数，在schema可以直接定义一个整数类型

***schema语法更加复杂，schema目前不能替代dtd

2、schema的快速入门

*创建一个schema文件后缀名是 .xsd

**根节点<schema>

**在schema文件里面

**属性 xmlns="http://www.w3.org/2001/XMLSchema"

-表示当前xml文件是一个约束文件

**targetNamespace="http://www.itcast.cn/20151111"

-使用schema约束文件，直接通过这个地址引入约束文件

**elementFormDefault="qualified"

步骤

（1）看xml中有多少个元素

（2）看简单元素和复杂元素

*如果复杂元素

子元素

</sequence>

</complexType>

（3）简单元素，写在复杂元素的

<elementname="person">

<elementname="name" type="string"></element>

<elementname="age" type="int"></element>

</sequence>

</complexType>

</element>

（4）在被约束文件里面引入约束文件

<personxmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xmlns="http://www.itcast.cn/20151111"

xsi:schemaLocation="http://www.itcast.cn/201511111.xsd">

**xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

--表示xml是一个被约束文件

**xmlns="http://www.itcast.cn/20151111"

--是约束文档里面targetNamespace

**xsi:schemaLocation="http://www.itcast.cn/20151111 1.xsd">

--targetNamespace 空格约束文档的地址路径

*<sequence>：表示元素的出现的顺序

<all>:元素只能出现一次

<choice>：元素只能出现其中的一个

maxOccurs="unbounded"：表示元素的出现的次数

<any></any>:表示任意元素

*可以约束属性

*写在复杂元素里面

***写在　</complexType>之前

－－

<attributename="id1" type="int"use="required"></attribute>

-name: 属性名称

-type：属性类型 intstirng

-use：属性是否必须出现required

*复杂的schema约束

<companyxmlns = "http://www.example.org/company"

xmlns:dept="http://www.example.org/department"

xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.example.org/companycompany.xsd http://www.example.org/department department.xsd"

*引入多个schema文件，可以给每个起一个别名

<employeeage="30">

<dept:name>100</dept:name>

*想要引入部门的约束文件里面的name，使用部门的别名 detp:元素名称

</employee>

3、sax解析的原理（********）

*解析xml有两种技术 dom 和sax

*根据xml的层级结构在内存中分配一个树形结构

**把xml中标签，属性，文本封装成对象

*sax方式：事件驱动，边读边解析

*在javax.xml.parsers包里面

**SAXParser

此类的实例可以从SAXParserFactory.newSAXParser() 方法获得

-parse(File f, DefaultHandler dh)

*两个参数

**第一个参数：xml的路径

**事件处理器

**SAXParserFactory

实例 newInstance() 方法得到

*画图分析一下sax执行过程

*当解析到开始标签时候，自动执行startElement方法

*当解析到文本时候，自动执行characters方法

*当解析到结束标签时候，自动执行endElement方法

4、使用jaxp的sax方式解析xml（会写*）

*sax方式不能实现增删改操作，只能做查询操作

**打印出整个文档

***执行parse方法，第一个参数xml路径，第二个参数是事件处理器

***创建一个类，继承事件处理器的类，

***重写里面的三个方法

* 获取到所有的name元素的值

**定义一个成员变量 flag=false

**判断开始方法是否是name元素，如果是name元素，把flag值设置成true

**如果flag值是true，在characters方法里面打印内容

**当执行到结束方法时候，把flag值设置成false

* 获取第一个name元素的值

**定义一个成员变量 idx=1

**在结束方法时候，idx+1idx++

**想要打印出第一个name元素的值，

-在characters方法里面判断，

--判断flag=true 并且 idx==1，在打印内容

5、使用dom4j解析xml

*dom4j，是一个组织，针对xml解析，提供解析器 dom4j

*dom4j不是javase的一部分，想要使用第一步需要怎么做？

***导入dom4j提供jar包

--创建一个文件夹 lib

--复制jar包到lib下面，

--右键点击jar包，build path -- add to build path

--看到jar包，变成奶瓶样子，表示导入成功

*得到document

SAXReader reader = new SAXReader();

Document document = reader.read(url);

*document的父接口是Node

*如果在document里面找不到想要的方法，到Node里面去找

*document里面的方法getRootElement() ：获取根节点返回的是Element

*Element也是一个接口，父接口是Node

-Element和Node里面方法

**getParent()：获取父节点

**addElement：添加标签

*element(qname)

**表示获取标签下面的第一个子标签

**qname：标签的名称

*elements(qname)

**获取标签下面是这个名称的所有子标签（一层）

**qname：标签名称

*elements()

**获取标签下面的所有一层子标签

6、使用dom4j查询xml

*解析是从上到下解析

*查询所有name元素里面的值

1、创建解析器

2、得到document

3、得到根节点 getRootElement() 返回Element

4、得到所有的p1标签

*elements("p1") 返回list集合

*遍历list得到每一个p1

5、得到name

*在p1下面执行 element("name")方法返回Element

6、得到name里面的值

*getText方法得到值

*查询第一个name元素的值

* 1、创建解析器

* 2、得到document

* 3、得到根节点

* 4、得到第一个p1元素

**element("p1")方法返回Element

* 5、得到p1下面的name元素

**element("name")方法返回Element

* 6、得到name元素里面的值

**getText方法

* */

*获取第二个name元素的值

* 1、创建解析器

* 2、得到document

* 3、得到根节点

* 4、得到所有的p1

**返回 list集合

* 5、遍历得到第二个p1

**使用list下标得到 get方法，集合的下标从 0 开始，想要得到第二个值，下标写 1

* 6、得到第二个p1下面的name

**element("name")方法返回Element

* 7、得到name的值

**getText方法

* */

7、使用dom4j实现添加操作

*在第一个p1标签末尾添加一个元素 <sex>nv</sex>

*步骤

* 1、创建解析器

* 2、得到document

* 3、得到根节点

* 4、获取到第一个p1

*使用element方法

* 5、在p1下面添加元素

*在p1上面直接使用 addElement("标签名称")方法返回一个Element

* 6、在添加完成之后的元素下面添加文本

* 在sex上直接使用 setText("文本内容")方法

* 7、回写xml

*格式化OutputFormat,使用createPrettyPrint方法，表示一个漂亮的格式

*使用类XMLWriter 直接new 这个类，传递两个参数

***第一个参数是xml文件路径 new FileOutputStream("路径")

***第二个参数是格式化类的值

* */

8、使用dom4j实现在特定位置添加元素

*在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>

*步骤

* 1、创建解析器

* 2、得到document

* 3、得到根节点

* 4、获取到第一个p1

* 5、获取p1下面的所有的元素

* **elements()方法返回 list集合

* ** 使用list里面的方法，在特定位置添加元素

* **首先创建元素在元素下面创建文本

-使用DocumentHelper类方法createElement创建标签

-把文本添加到标签下面使用 setText("文本内容")方法

* *** list集合里面的 add(int index, E element)

* - 第一个参数是位置下标，从0开始

* - 第二个参数是要添加的元素

* 6、回写xml

* */

**可以对得到document的操作和回写xml的操作，封装成方法

**也可以把传递的文件路径，封装成一个常量

***好处：可以提高开发速度，可以提交代码可维护性

-比如想要修改文件路径（名称），这个时候只需要修改常量的值就可以了，其他代码不需要做任何改变

9、使用dom4j实现修改节点的操作

*修改第一个p1下面的age元素的值 <age>30</age>

*步骤

* 1、得到document

* 2、得到根节点，然后再得到第一个p1元素

* 3、得到第一个p1下面的age

element("")方法

* 4、修改值是 30

* * 使用setText("文本内容")方法

* 5、回写xml

* */

10、使用dom4j实现删除节点的操作

*删除第一个p1下面的<school>ecit</school>元素

*步骤

* 1、得到document

* 2、得到根节点

* 3、得到第一个p1标签

* 4、得到第一个p1下面的school元素

* 5、删除（使用p1删除school）

* * 得到school的父节点

-第一种直接得到p1

-使用方法 getParent方法得到

*删除操作

-在p1上面执行remove方法删除节点

* 6、回写xml

* */

11、使用dom4j获取属性的操作

*获取第一个p1里面的属性id1的值

*步骤

* 1、得到document

* 2、得到根节点

* 3、得到第一个p1元素

* 4、得到p1里面的属性值

-p1.attributeValue("id1");

-在p1上面执行这个方法，里面的参数是属性名称

* */

12、使用dom4j支持xpath的操作

*可以直接获取到某个元素

*第一种形式

/AAA/DDD/BBB：表示一层一层的，AAA下面 DDD下面的BBB

*第二种形式

//BBB：表示和这个名称相同，表示只要名称是BBB，都得到

*第三种形式

/*:所有元素

*第四种形式

**　BBB[1]：　表示第一个BBB元素

××　BBB[last()]：表示最后一个BBB元素

*第五种形式

**//BBB[@id]：表示只要BBB元素上面有id属性，都得到

*第六种形式

**//BBB[@id='b1'] 表示元素名称是BBB,在BBB上面有id属性，并且id的属性值是b1

13、使用dom4j支持xpath具体操作

**默认的情况下，dom4j不支持xpath

**如果想要在dom4j里面是有xpath

*第一步需要，引入支持xpath的jar包，使用 jaxen-1.1-beta-6.jar

**需要把jar包导入到项目中

**在dom4j里面提供了两个方法，用来支持xpath

***selectNodes("xpath表达式")

-获取多个节点

***selectSingleNode("xpath表达式")

-获取一个节点

**使用xpath实现：查询xml中所有name元素的值

**所有name元素的xpath表示： //name

**使用selectNodes("//name");

**代码和步骤

* 1、得到document

* 2、直接使用selectNodes("//name")方法得到所有的name元素

* */

//得到document

Documentdocument = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//使用selectNodes("//name")方法得到所有的name元素

List<Node>list = document.selectNodes("//name");

//遍历list集合

for(Node node : list) {

//node是每一个name元素

//得到name元素里面的值

Strings = node.getText();

System.out.println(s);

}

**使用xpath实现：获取第一个p1下面的name的值

*//p1[@id1='aaaa']/name

*使用到selectSingleNode("//p1[@id1='aaaa']/name")

*步骤和代码

* 1、得到document

* 2、直接使用selectSingleNode方法实现

* -xpath ：//p1[@id1='aaaa']/name

* */

//得到document

Documentdocument = Dom4jUtils.getDocument(Dom4jUtils.PATH);

//直接使用selectSingleNode方法实现

Nodename1 = document.selectSingleNode("//p1[@id1='aaaa']/name"); //name的元素

//得到name里面的值

Strings1 = name1.getText();

System.out.println(s1);

14、实现简单的学生管理系统

**使用xml当做数据，存储学生信息

**创建一个xml文件，写一些学生信息

**增加操作

* 1、创建解析器

* 2、得到document

* 3、获取到根节点

* 4、在根节点上面创建stu标签

* 5、在stu标签上面依次添加idname age

**addElement方法添加

* 6、在id name age上面依次添加值

* **setText方法

* 7、回写xml

* */

**删除操作（根据id删除）

* 1、创建解析器

* 2、得到document

* 3、获取到所有的id

* 使用xpath //id 返回 list集合

* 4、遍历list集合

* 5、判断集合里面的id和传递的id是否相同

* 6、如果相同，把id所在的stu删除

* */

**查询操作（根据id查询）

* 1、创建解析器

* 2、得到document

* 3、获取到所有的id

* 4、返回的是list集合，遍历list集合

* 5、得到每一个id的节点

* 6、id节点的值

* 7、判断id的值和传递的id值是否相同

* 8、如果相同，先获取到id的父节点stu

* 9、通过stu获取到name age值

** 把这些值封装到一个对象里面返回对象

* */

0 0

web day6 DOM＆XML(JAXP的SAX解析XML,schema入门,dom4j＆XPath的增删改查)

1、schema约束

2、schema的快速入门

3、sax解析的原理（********）

4、使用jaxp的sax方式解析xml（**会写***）

5、使用dom4j解析xml

6、使用dom4j查询xml

7、使用dom4j实现添加操作

8、使用dom4j实现在特定位置添加元素

9、使用dom4j实现修改节点的操作

10、使用dom4j实现删除节点的操作

11、使用dom4j获取属性的操作

12、使用dom4j支持xpath的操作

13、使用dom4j支持xpath具体操作

14、实现简单的学生管理系统

4、使用jaxp的sax方式解析xml（会写*）