Java进阶学习第五天——XML入门

来源：互联网发布：农业银行app网络异常编辑：程序博客网时间：2024/05/29 13:20

文档版本开发工具测试平台工程名字日期作者备注 V1.0 2016.04.14 lutianfei none

onsubmit事件

控制表单提交
- 需要把onsubmit作用在表单上 <form onsubmit="">
- 值的写法：onsubmit="return run()"
- run()必须要有返回值，必须返回true或者false。
- 如果返回是true，表单可以提交，如果返回false，表单不能提交。如果没有返回值，默认是表单提交。
- run()的逻辑写什么？
  - 表单的校验。

<script type="text/javascript">    // 给姓名提示    function run1(){        var uspan = document.getElementById("uspan");        uspan.innerHTML = "不能输入特殊字符";    }    // 表单校验，必须有返回值    function run(){        // 校验姓名        var name = document.getElementById("nameId").value;        if(name == "" || name.length == 0){            var uspan = document.getElementById("uspan");            uspan.innerHTML = "用户名不能为空";            return false;        }        // 校验密码        var pwd = document.getElementById("pwdId").value;        if(pwd == "" || pwd.length < 6){            var pspan = document.getElementById("pspan");            pspan.innerHTML = "密码至少6位";            return false;        }        // 确认密码        var repwd = document.getElementById("repwdId").value;        if(pwd != repwd){            var rpspan = document.getElementById("rpspan");            rpspan.innerHTML = "两次密码不一致";            return false;        }        // 确认密码        //     /^表达式$/.test(string)    返回true获取false        var email = document.getElementById("emailId").value;        if(!/^([a-zA-Z0-9_\.\-])+\@(([a-zA-Z0-9\-])+\.)+([a-zA-Z0-9]{2,4})+$/.test(email)){            var espan = document.getElementById("espan");            espan.innerHTML = "邮箱格式不正确";            return false;        }    }    // 使用js提交表单    function run2(){        // 通过id获取form        // var form = document.getElementById("formId");        // 通过form的name的属性获取表单        var form = document.form1;        //var name = document.form1.username.value;        //alert(name);        // 设置提交的路径        form.action = "success.html";        form.method = "get";        // 提交表单        form.submit();    }</script></head><body>    <form id="formId" name="form1"  onsubmit="return run()">        <table border="1" width="60%">            <tr>                <td>输入姓名</td>                <td>                    <input type="text" name="username" id="nameId" onfocus="run1()"/><span id="uspan"></span>                </td>            </tr>            <tr>                <td>输入密码</td>                <td>                    <input type="password" name="password" id="pwdId" /><span id="pspan"></span>                </td>            </tr>            <tr>                <td>确认密码</td>                <td>                    <input type="password" name="repassword" id="repwdId" /><span id="rpspan"></span>                </td>            </tr>            <tr>                <td>                    输入邮箱                </td>                <td>                    <input type="text" name="email" id="emailId" /><span id="espan"></span>                </td>            </tr>            <tr>                <td colspan="2">                    <!-- <input type="submit" value="注册">  -->                    <input type="button" value="注册" onclick="run2()">                </td>            </tr>        </table>    </form></body>

通过js提交表单

    // 通过id获取form    // var form = document.getElementById("formId");    // 通过form的name的属性获取表单    var form = document.form1;    //var name = document.form1.username.value;    //alert(name);    // 设置提交的路径    form.action = "success.html";    form.method = "get";    // 提交表单    form.submit();

XML语言

XML的简介

XML是指可扩展标记语言(eXtensible Markup Language)，它是一种标记语言，很类似HTML。它被设计的宗旨是传输数据，而非显示数据。
XML标签没有被预定义，需要用户自行定义标签。
XML技术是W3C组织(World Wide Web Consortium万维网联盟)发布的，目前遵循的是W3C组织于2000年发布的XML1.0规范。
XML被广泛认为是继Java之后在Internet上最激动人心的新技术。
XML传输数据，HTML是显示数据。
XML的版本：
- XML1.0（使用该版本）
- XML1.1（不向下兼容）

XML技术用于解决什么问题

XML语言出现的根本目的在于描述有关系的数据。
XML是一种通用的数据交换格式。
在XML语言中，它允许用户自定义标签。一个标签用于描述一段数据；一个标签可分为开始标签和结束标签，在起始标签之间，又可以使用其它标签描述其它数据，以此来实现数据关系的描述。
XML中的数据必须通过软件程序来解析执行或显示；这样的解析程序称之为Parser(解析器)。

<?xml version="1.0" encoding="UTF-8"?><中国>    <北京>        <海淀></海淀>        <丰台></丰台>    </北京>    <山东>        <济南></济南>        <青岛></青岛>    </山东>    <湖北>        <武汉></武汉>        <荆州></荆州>    </湖北></中国>

XML常见应用

XML技术除用于保存有关系的数据之外，它还经常用作软件配置文件，以描述程序模块之间的关系。(如后面将要学习到的Struts、Spring和Hibernate都是基于XML作为配置文件的)
在一个软件系统中，通过XML配置文件可以提高系统的灵活性。即程序的行为是通过XML文件来配置的，而不是硬编码。
数据交换：不同语言之间用来交换数据
应用
- 作为配置文件。
- 可以在系统与系统之间进行数据的传输。

XML的语法

一个XML文件分为如下几部分内容：
- 文档声明
- 元素
- 属性
- 注释
- CDATA区、特殊字符
- 处理指令（PI:Processing Instruction）

文档声明（重点）

最简单的语法： <?xml version="1.0" ?>
文档声明必须出现在xml文件的第一行和第一列的位置。
属性：
- version=”1.0” XML的版本（必须写）
- encoding=”UTF-8” 编码集（可选的）
- standalone=”yes或者no” 代表xml的文件是否是独立的。（如果是no，不独立，可以引入外部的文件）（可选的）
  - 不写该属性，可以引入外部的文件。
乱码问题
- 产生的原因：保存文件时和打开文件时采用的编码不一致。
- 解决办法：保存文件可打开文件采用的编码一致就ok。（MyEclipse不会产生乱码问题）

元素

XML元素指XML文件中出现的标签。一个标签分为起始和结束标签(不能省略)。一个标签有如下几种书写形式：
- 包含标签主体：<mytag>some content</mytag>
- 不含标签主体：
- 一个标签中可以嵌套若干子标签，但所有标签必须合理的嵌套，不允许有交叉嵌套。
- <mytag1><mytag2></mytag1></mytag2>:错误
一个XML文档必须有且仅有一个根标签，其他标签都是这个根标签的子标签或孙标签。
命名规范：
- 区分大小写错误的：<a> </A> 代表两个标签
- 不能以数字和-开头错误的：<1a> <-a>
- 不能以XML（Xml XML xml）开头错误的：<xmlaa>
- 不能包含空格和冒号。
由于在XML中，空格和换行都作为原始内容被处理，所以，在编写XML文件时，使用换行和缩进等方式来让原文件中的内容清晰可读的“良好”书写习惯可能要被迫改变。例如：下面两段内容的意义是不一样的。

属性

在同一个元素上，不能有相同的属性。（重点）
可以使用双引号或者单引号。
一个元素可以有多个属性，每个属性都有它自己的名称和取值，例如：<mytag name=“value” …/>
属性值一定要用引号(单引号或双引号)引起来。
属性名称的命名规范与元素的命名规范相同
元素中的属性是不允许重复的
在XML技术中，标签属性所代表的信息也可以被改成用子元素的形式来描述，例如：

<mytag>    <name>        <firstName/>        <lastName/>    </name></mytag>

注释

和HTML的注释相同,注释不能有嵌套。
-

特殊字符

< : &lt;
> : &gt;
& : &amp;
" : &quot;
' : &apos;
< 和 & 的符号要用转义字符
> “ ‘ 可以不使用转义字符

CDATA区

CDATA是Character Data的缩写
作用：把标签当做普通文本内容；
语法：<![CDATA[内容]]>
把标签中的内容作为字符串。
语法：

<![CDATA[  <itcast>www.itcast.cn</itcast>]]>

PI（处理指令）

为了替换替换HTML

XML的约束

为什么需要约束

XML都是用户自定义的标签，若出现小小的错误，软件程序将不能正确地获取文件中的内容而报错。
XML技术中，可以编写一个文档来约束一个XML的书写规范，这个文档称之为约束。
两个概念：
- 格式良好的XML：遵循XML语法的XML
- 有效的XML：遵循约束文档的XML
总之：约束文档定义了在XML中允许出现的元素名称 属性、及元素出现的顺序等等。

常用的XML约束技术

XML DTD
XML Schema

DTD的约束

快速入门

将DTD与XML文档关联三种方式

方式一：使用内部DTD:可以在XML的文件中直接书写DTD的代码。（经常使用）

<!DOCTYPE 根节点 [ DTD的代码 ]>

<?xml version="1.0" encoding="UTF-8" standalone="yes"?><!DOCTYPE 书架 [    <!ELEMENT 书架 (书+)>    <!ELEMENT 书 (书名,作者,售价)>    <!ELEMENT 书名 (#PCDATA)>    <!ELEMENT 作者 (#PCDATA)>    <!ELEMENT 售价 (#PCDATA)>]>// xml代码：<书架>    <书>        <书名>Java就业培训教程</书名>        <作者>张孝祥</作者>        <售价>39.00元</售价>    </书>    ...</书架>

方式二：使用本地DTD

<!DOCTYPE 根节点 SYSTEM “DTD的地址” >

方式三：使用网络DTD

<!DOCTYPE 根节点 PUBLIC “DTD的名称” “DTD的地址” >

元素定义

在DTD文档中使用ELEMENT关键字来声明一个XML元素。
语法：<!ELEMENT 元素名称元素类型>
- 元素类型
  - (#PCDATA) 指示元素的主体内容只能是普通的文本.(Parsed Character Data)
  - EMPTY 用于指示元素的主体为空。比如<br/>
  - ANY 用于指示元素的主体内容为任意类型。
  - (子元素) 指示元素中包含的子元素
    - 子元素之间的关系
      - , 子元素出现是有顺序的,必须按照声明顺序去编写XML文档。
      - | 子元素只能出现一个,任选其一
      - 子元素出现的次数
        + 子元素出现1次或多次
        * 子元素出现0次或多次
        ? 子元素出现0次或1次

    <!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

属性定义(AttributeList)

写法：

<!ATTLIST 元素名称                 属性名称 属性类型 属性约束                 属性名称 属性类型 属性约束            >

属性值类型：
- CDATA：表示属性的取值为普通的文本字符串
- ENUMERATED (DTD没有此关键字)：表示枚举，只能从枚举列表中任选其一，如(鸡肉|牛肉|猪肉|鱼肉)
- ID:表示属性的取值不能重复（不能只写数字）
设置说明
- #REQUIRED：表示该属性必须出现
- #IMPLIED：表示该属性可有可无
- #FIXED:表示属性的取值为一个固定值。语法：#FIXED "固定值"
- 直接值：表示属性的取值为该默认值

<!ATTLIST 页面作者          姓名 CDATA #IMPLIED          年龄 CDATA #IMPLIED          联系信息 CDATA #REQUIRED          网站职务 CDATA #FIXED "页面作者"          个人爱好 CDATA "上网"       >

实体定义（用的不多）

实体用于为一段内容创建一个别名，以后在XML文档中就可以使用别名引用这段内容了。
在DTD定义中，一条<!ENTITY …>语句用于定义一个实体。
<!ENTITY 别名 “值”>
在元素中引用 &别名;
<!ENTITY 别名 "值" >
需要在xml中引入别名，浏览器打开文件后，在引入的位置上显示值的。

<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE 书架 [    <!ELEMENT 书架 (书+)>    <!ELEMENT 书 (书名,作者,售价,简介)>    <!ELEMENT 书名 (#PCDATA)>    <!ELEMENT 作者 (#PCDATA)>    <!ELEMENT 售价 (#PCDATA)>    <!ELEMENT 简介 (#PCDATA)>    <!ATTLIST 书        出版社 (清华出版社|人民出版社) #REQUIRED        编号 ID #IMPLIED        出版日期 CDATA  #FIXED "2014-11-17"    >    <!ENTITY username "张三" >]><书架>    <书 出版社="清华出版社" 出版日期="2014-11-17">        <书名>javaweb开发大全</书名>        <作者>&username;</作者>        <售价>99.8元</售价>        <简介>这是不错啊</简介>    </书>    <书 编号="b1" 出版社="人民出版社">        <书名>葵花宝典</书名>        <作者>岳不群</作者>        <售价>99.8两</售价>        <简介>欲练此功...</简介>    </书></书架>

<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE TVSCHEDULE [    <!ELEMENT TVSCHEDULE (CHANNEL+)>    <!ELEMENT CHANNEL (BANNER,DAY+)>    <!ELEMENT BANNER (#PCDATA)>    <!ELEMENT DAY (DATE,(HOLIDAY|PROGRAMSLOT+)+)>    <!ELEMENT HOLIDAY (#PCDATA)>    <!ELEMENT DATE (#PCDATA)>    <!ELEMENT PROGRAMSLOT (TIME,TITLE,DESCRIPTION?)>    <!ELEMENT TIME (#PCDATA)>    <!ELEMENT TITLE (#PCDATA)>     <!ELEMENT DESCRIPTION (#PCDATA)>    <!ATTLIST TVSCHEDULE NAME CDATA #REQUIRED>    <!ATTLIST CHANNEL CHAN CDATA #REQUIRED>    <!ATTLIST PROGRAMSLOT VTR CDATA #IMPLIED>    <!ATTLIST TITLE RATING CDATA #IMPLIED>    <!ATTLIST TITLE LANGUAGE CDATA #IMPLIED>]><TVSCHEDULE NAME="">    <CHANNEL CHAN="">        <BANNER>CCAV</BANNER>        <DAY>            <DATE>2014-11-17</DATE>            <PROGRAMSLOT>                <TIME>19:00</TIME>                <TITLE>新闻联播</TITLE>            </PROGRAMSLOT>        </DAY>    </CHANNEL></TVSCHEDULE>

解析XML

XML解析方式分为两种：DOM方式和SAX方式
- DOM：Document Object Model，文档对象模型。这种方式是W3C推荐的处理XML的一种方式。
- SAX：Simple API for XML。这种方式不是官方标准，属于开源社区XML-DEV，几乎所有的XML解析器都支持它。
- 区别：
  - DOM解析XML
    - 在内存中形成树状结构
    - 缺点：如果文档过大，容易产生内存溢出的问题。
    - 优点：方便做增删改的操作
  - SAX解析
    - 基于事件驱动，边读边解析
    - 优点：不会产生内存溢出问题。
    - 缺点：不能做增删改操作。（DOM4J在内存生成树状结构，可以做增删改操作）
XML解析开发包
- JAXP：是SUN公司推出的解析标准实现。
- Dom4J：是开源组织推出的解析开发包。(牛，大家都在用，包括SUN公司的一些技术的实现都在用)
- JDom：是开源组织推出的解析开发包。

JAXP解析包

JAXP:(Java API for XML Processing)开发包是JavaSE的一部分，它由以下几个包及其子包组成：
org.w3c.dom:提供DOM方式解析XML的标准接口
org.xml.sax:提供SAX方式解析XML的标准接口
javax.xml:提供了解析XML文档的类
javax.xml.parsers包中，定义了几个工厂类。我们可以通过调用这些工厂类，得到对XML文档进行解析的DOM和SAX解析器对象。
- DocumentBuilderFactory
- SAXParserFactory

DOM编程

DOM模型(document object model)

DOM解析器在解析XML文档时，会把文档中的所有元素，按照其出现的层次关系，解析成一个个Node对象(节点)。
在dom中，节点之间关系如下：
位于一个节点之上的节点是该节点的父节点(parent)
一个节点之下的节点是该节点的子节点（children）
同一层次，具有相同父节点的节点是兄弟节点（sibling）
一个节点的下一个层次的节点集合是节点后代(descendant)
父、祖父节点及所有位于节点上面的，都是节点的祖先(ancestor)

节点类型Node对象

Node对象提供了一系列常量来代表结点的类型，当开发人员获得某个Node类型后，就可以把Node节点转换成相应的节点对象(Node的子类对象)，以便于调用其特有的方法。（查看API文档）
Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加、修改、删除XML文档的内容了。

DOM方式解析XML文件

javax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 ， DocumentBuilderFactory是一个抽象工厂类，它不能直接实例化，但该类提供了一个newInstance方法 ，这个方法会根据本地平台默认安装的解析器，自动创建一个工厂的对象并返回。
JAXP 在DOM方式下解析HTML使用的类和方法
- 获取解析器工厂类 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
- 获取解析器对象：DocumentBuilder builder = factory.newDocumentBuilder();
- 解析XML的文档，返回document对象：Document document = builder.parse(“src/book2.xml”);

通过document.getElementsByTagName(“”)可以获取节点集合 返回NodeList
通过Document.createElement(“”)可以创建元素对象。
Node对象中可以设置文本内容 setTextContent()
通过Node的appendChild()方法加入子节点。
需要把内存中的DOM树形结构回写到xml文件中。
TransformerFactory工厂类创建Transformer回写类，通过transform(Souuce,Result)方法回写xml。
- New DOMSource(document) 和 new StreamResult(xml) 回写完成。

更新XML文档

javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出
- 例如把xml文件应用样式表后转成一个html文档。利用这个对象，当然也可以把Document对象又重新写入到一个XML文件中。
Transformer类通过transform方法完成转换操作，该方法接收一个源和一个目的地。我们可以通过：
- javax.xml.transform.dom.DOMSource类来关联要转换的document对象，
- 用javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。
Transformer对象通过TransformerFactory获得。

//book2.xml<书架>    <书 编号="b2">        <书名>javaweb开发大全</书名>        <作者>班长</作者>        <售价>99.8元</售价>        <简介>这是不错啊</简介>    </书>    <书>        <书名>葵花宝典</书名>        <作者>岳不群</作者>        <售价>99.8两</售价>        <简介>欲练此功...</简介>    </书></书架>//JaxpDomTest.javapackage cn.itcast.jaxp;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import javax.xml.transform.Transformer;import javax.xml.transform.TransformerFactory;import javax.xml.transform.dom.DOMSource;import javax.xml.transform.stream.StreamResult;import org.w3c.dom.Document;import org.w3c.dom.Element;import org.w3c.dom.Node;import org.w3c.dom.NodeList;import cn.itcast.utils.JaxpDomUtil;/** * JAXP的DOM解析XML * @author Administrator * */public class JaxpDomTest {    public static void main(String[] args) {        try {            run3();        } catch (Exception e) {            e.printStackTrace();        }    }    /**     * 获取作者的文本内容     * @throws Exception      */    public static void run1() throws Exception{        // 获取解析器工厂类        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();        // 获取解析器对象        DocumentBuilder builder = factory.newDocumentBuilder();        // 解析XML的文档，返回document对象        Document document = builder.parse("src/book2.xml");        // 获取作者元素对象的集合，返回NodeList        NodeList nodeList = document.getElementsByTagName("作者");        // 循环遍历，拿到每一个作者，打印文本的内容，getTextContent()        for(int i=0;i<nodeList.getLength();i++){            Node node = nodeList.item(i);            System.out.println(node.getTextContent());        }    }    /**     * 需求：在第二本下，在末尾添加子节点     * @throws Exception     */    public static void run2() throws Exception{        // 获取工厂类        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();        // 获取解析器        DocumentBuilder builder = factory.newDocumentBuilder();        // 解析xml，返回document对象        Document document = builder.parse("src/book2.xml");        // 获取第二本书        Node book2 = document.getElementsByTagName("书").item(1);        // 创建元素对象        Element cat = document.createElement("猫");        // 设置文本内容        cat.setTextContent("我是猫");        // 把元素对象添加到第二本书下        book2.appendChild(cat);        // 回写        // 创建回写类的工厂        TransformerFactory transformerFactory =  TransformerFactory.newInstance();        // 获取回写类        Transformer transformer = transformerFactory.newTransformer();        // 调用回写的方法        transformer.transform(new DOMSource(document), new StreamResult("src/book2.xml"));    }    /**     * 删除节点     * @throws Exception      */    public static void run3() throws Exception{        String path = "src/book2.xml";        // 获取文档对象        Document document = JaxpDomUtil.getDocument(path);        // 获取猫        Node cat = document.getElementsByTagName("猫").item(0);        // 获取书（猫的父节点）        Node book2 = cat.getParentNode();        // 通过书删除猫        book2.removeChild(cat);        // 回写        JaxpDomUtil.writeXML(document, path);    }}

JAXP 的封装和删除

package cn.itcast.utils;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import javax.xml.transform.Transformer;import javax.xml.transform.TransformerFactory;import javax.xml.transform.dom.DOMSource;import javax.xml.transform.stream.StreamResult;import org.w3c.dom.Document;/** * JAPTDOM解析的工具类 * @author Administrator * */public class JaxpDomUtil {    /**     * 通过path获取document对象     * @param path     * @return     * @throws Exception      */    public static Document getDocument(String path) throws Exception{        // 获取工厂类        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();        // 获取解析器对象        DocumentBuilder builder = factory.newDocumentBuilder();        // 解析xml        return builder.parse(path);    }    /**     * 回写方法     * @param document     * @param path     * @throws Exception     */    public static void writeXML(Document document,String path) throws Exception{        // 获取回写类的工厂        TransformerFactory factory = TransformerFactory.newInstance();        // 获取回写类        Transformer transformer = factory.newTransformer();        // 回写        transformer.transform(new DOMSource(document), new StreamResult(path));    }}

1 0

Java进阶学习第五天——XML入门

onsubmit事件

通过js提交表单

XML语言

XML的简介

XML技术用于解决什么问题

XML常见应用

XML的语法

文档声明（重点）

元素

属性

注释

特殊字符

CDATA区

PI（处理指令）

XML的约束

为什么需要约束

常用的XML约束技术

DTD的约束

将DTD与XML文档关联三种方式

方式一： 使用内部DTD:可以在XML的文件中直接书写DTD的代码。（经常使用）

方式二：使用本地DTD

方式三： 使用网络DTD

元素定义

属性定义(AttributeList)

实体定义（用的不多）

解析XML

JAXP解析包

DOM编程

DOM模型(document object model)

节点类型Node对象

DOM方式解析XML文件

更新XML文档

JAXP 的封装和删除

方式一：使用内部DTD:可以在XML的文件中直接书写DTD的代码。（经常使用）

方式三：使用网络DTD