XML约束

来源:互联网 发布:2017国培网络研修心得 编辑:程序博客网 时间:2024/06/05 01:59

什么是XML约束

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。

常用的约束技术

  • XML DTD
  • XML Schema

DTD约束快束入门

DTD(Document Type Definition),全称为文档类型定义。

文件清单:book.xml

<?xml version="1.0" ?><!DOCTYPE 书架 SYSTEM "book.dtd"><书架>    <>        <书名>Java就业培训教程</书名>        <作者>张孝祥</作者>        <售价>39.00元</售价>    </>    <>        <书名>JavaScript网页开发</书名>        <作者>张孝祥</作者>        <售价>28.00元</售价>    </></书架>

文件清单:book.dtd

<!ELEMENT 书架 (书+)>    <!ELEMENT 书 (书名,作者,售价)>    <!ELEMENT 书名 (#PCDATA)>    <!ELEMENT 作者 (#PCDATA)>    <!ELEMENT 售价 (#PCDATA)>

DTD文件应使用UTF-8或Unicode

使用eclipse可以校验XML文档分正确性。

编写DTD约束的两种方式

DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。

在xml文件内编写DTD

<?xml version="1.0" encoding="UTF-8" standalone="yes"?><!DOCTYPE 书架 [    <!ELEMENT 书架 (书+)>    <!ELEMENT 书 (书名,作者,售价)>    <!ELEMENT 书名 (#PCDATA)>    <!ELEMENT 作者 (#PCDATA)>    <!ELEMENT 售价 (#PCDATA)>]><书架>    <>        <书名>Java就业培训教程</书名>        <作者>张孝祥</作者>        <售价>39.00元</售价>    </>    ...</书架>

引用DTD约束

XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

  • 当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">

例如: <!DOCTYPE 书架 SYSTEM "book.dtd">

  • 当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">

例如:

<!DOCTYPE web-app PUBLIC         "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"        "http://java.sun.com/dtd/web-app_2_3.dtd">

DTD约束语法细节

  • 元素定义
  • 属性定义
  • 实体定义

元素定义

  • 在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
<!ELEMENT 元素名称 元素类型> 
  • 元素类型可以是元素内容、或类型

如为元素内容:则需要使用()括起来,如

<!ELEMENT 书架 (书名,作者,售价)><!ELEMENT 书名 (#PCDATA)>

如为元素类型,则直接书写,DTD规范定义了如下几种类型

  • EMPTY:用于定义空元素,例如<br/> <hr/>
  • ANY:表示元素内容为任意类型。

  • 元素内容中可以使用如下方式,描述内容的组成关系元素

    • 内容使用空白符分隔,表示出现顺序没有要求:
      <!ELEMENT MYFILE (TITLE AUTHOR EMAIL)>
    • 用逗号分隔,表示内容的出现顺序必须与声明时一致。
      <!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
    • 用|分隔,表示任选其一,即多个只能出现一个
      <!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>
  • 在元素内容中也可以使用+、*、?等符号表示元素出现的次数:

        +: 一次或多次 (书+)        ?: 0次或一次 (书?)        *: 0次或多次  (书*)
  • 也可使用圆括号( )批量设置,例
<!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

属性定义

  • xml文档中的标签属性需通过ATTLIST为其设置属性
  • 语法格式:
<!ATTLIST 元素名         属性名1 属性值类型 设置说明        属性名2 属性值类型 设置说明        ……    >
  • 属性声明举例:
<!ATTLIST 商品    类别 CDATA #REQUIRED    颜色 CDATA #IMPLIED>
  • 对应XML文件:
<商品 类别="服装" 颜色="黄色"></商品>     <商品 类别="服装"></商品> 
  • 设置说明:
#REQUIRED:必须设置该属性#IMPLIED:可以设置也可以不设置 #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值 

直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。

  • 举例:
   <!ATTLIST 页面作者          姓名 CDATA #IMPLIED          年龄 CDATA #IMPLIED          联系信息 CDATA #REQUIRED          网站职务 CDATA #FIXED "页面作者"          个人爱好 CDATA "上网"       > 

常用属性值类型

  • CDATA:表示属性值为普通文本字符串。
  • ENUMERATED
  • ID
  • ENTITY(实体)

属性值类型:ENUMERATED

  • 属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)
<?xml version = "1.0" encoding="GB2312" standalone="yes"?><!DOCTYPE 购物篮 [    <!ELEMENT 肉 EMPTY>    <!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">]> <购物篮>    < 品种="鱼肉"/>    < 品种="牛肉"/>    </></购物篮>

属性值类型:ID

  • 表示属性的设置值为一个唯一值。
  • ID 属性的值只能由字母,下划线开始,不能出现空白字符
<?xml version = "1.0" encoding="GB2312" ?><!DOCTYPE 联系人列表[    <!ELEMENT 联系人列表 ANY>    <!ELEMENT 联系人(姓名,EMAIL)>    <!ELEMENT 姓名(#PCDATA)>    <!ELEMENT EMAIL(#PCDATA)>    <!ATTLIST 联系人 编号 ID #REQUIRED>]><联系人列表>    <联系人 编号="a1">        <姓名>张三</姓名>        <EMAIL>zhang@it315.org</EMAIL>     </联系人>    <联系人 编号="a2">        <姓名>李四</姓名>        <EMAIL>li@it315.org</EMAIL>    </联系人></联系人列表>

实体定义

  • 实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
  • 在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
  • 实体可分为两种类型:引用实体和参数实体。

实体定义:引用实体

  • 引用实体主要在 XML 文档中被应用
  • 语法格式:

<!ENTITY 实体名称 "实体内容" >:直接转变成实体内容。
相当于把实体内容赋值给一个变量,变量名为实体名称,所以可以通过实体名称获得实体内容。

  • 引用方式:
&实体名称;
  • 举例:
<!ENTITY copyright "I am a programmer">      ……     &copyright;

上面相当于: &copyright; == “I am a programmer”

实体定义:参数实体

  • 参数实体被 DTD 文件自身使用
  • 语法格式:
<!ENTITY % 实体名称 "实体内容" >
  • 引用方式:
%实体名称;
  • 举例1:
 <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">    <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>     <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>
  • 举例2:
<!ENTITY % common.attributes     " id ID #IMPLIED     account CDATA #REQUIRED ">...<!ATTLIST purchaseOrder %common.attributes;><!ATTLIST item %common.attributes;>

XML Schema

  • XML Schema 也是一种用于定义和描述 XML 文档结构与内容的模式语言,其出现是为了克服 DTD 的局限性
  • XML Schema VS DTD:
    • XML Schema符合XML语法结构。
    • DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
    • XML Schema对名称空间支持得非常好。
    • XML Schema比XML DTD支持更多的数据类型,并支持用户自定义新的数据类型。
    • XML Schema定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制。

Schema约束快速入门

  • XML Schema 文件自身就是一个XML文件,但它的扩展名通常为.xsd。
  • 一个XML Schema文档通常称之为模式文档(约束文档),遵循这个文档书写的xml文件称之为实例文档。
  • 和XML文件一样,一个XML Schema文档也必须有一个根结点,但这个根结点的名称为Schema。
  • 编写了一个XML Schema约束文档后,通常需要把这个文件中声明的元素绑定到一个URI地址上,在XML Schema技术中有一个专业术语来描述这个过程,即把XML Schema文档声明的元素绑定到一个名称空间上,以后XML文件就可以通过这个URI(即名称空间)来告诉解析引擎,xml文档中编写的元素来自哪里,被谁约束。

Schema入门案例

book.xsd文件

<?xml version="1.0" encoding="UTF-8" ?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"                      targetNamespace="http://www. itcast.cn"                      elementFormDefault="qualified">    <xs:element name='书架' >        <xs:complexType>            <xs:sequence maxOccurs='unbounded' >                <xs:element name='书' >                    <xs:complexType>                        <xs:sequence>                            <xs:element name='书名' type='xs:string' />                            <xs:element name='作者' type='xs:string' />                            <xs:element name='售价' type='xs:string' />                        </xs:sequence>                    </xs:complexType>                </xs:element>            </xs:sequence>        </xs:complexType>    </xs:element></xs:schema>
<?xml version="1.0" encoding="UTF-8"?><itcast:书架 xmlns:itcast="http://www.itcast.cn"                xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"                xsi:schemaLocation=“http://www.itcast.cn book.xsd">    <itcast:书>        <itcast:书名>JavaScript网页开发</itcast:书名>        <itcast:作者>张孝祥</itcast:作者>        <itcast:售价>28.00元</itcast:售价>    </itcast:书></itcast:书架>

名称空间的概念

在XML Schema中,每个约束模式文档都可以被赋以一个唯一的名称空间,名称空间用一个唯一的URI(Uniform Resource Identifier,统一资源标识符)表示。 在Xml文件中书写标签时,可以通过名称空间声明(xmlns),来声明当前编写的标签来自哪个Schema约束文档。如:

<itcast:书架 xmlns:itcast=“http://www.itcast.cn”>        <itcast:书>……</itcast:书>    </itcast:书架>

此处使用itcast来指向声明的名称,以便于后面对名称空间的引用。
注意:名称空间的名字语法容易让人混淆,尽管以 http:// 开始,那个 URL 并不指向一个包含模式定义的文件。事实上,这个 URL:http://www.itcast.cn根本没有指向任何文件,只是一个分配的名字.

使用名称空间引入Schema

为了在一个XML文档中声明它所遵循的Schema文件的具体位置,通常需要在Xml文档中的根结点中使用schemaLocation属性来指定,例如:

<itcast:书架 xmlns:itcast="http://www.itcast.cn"        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"        xsi:schemaLocation=“http://www.itcast.cn book.xsd">

schemaLocation此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置,两者之间用空格分隔。
注意,在使用schemaLocation属性时,也需要指定该属性来自哪里。

使用默认名称空间

  • 基本格式:
xmlns="URI"  
  • 举例:
<书架 xmlns="http://www.it315.org/xmlbook/schema"        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"        xsi:schemaLocation=“http://www.itcast.cn book.xsd">        <>        <书名>JavaScript网页开发</书名>        <作者>张孝祥</作者>        <售价>28.00元</售价>        </>    <书架>

使用名称空间引入多个XML Schema文档

文件清单:xmlbook.xml

<?xml version="1.0" encoding="UTF-8"?><书架 xmlns="http://www.it315.org/xmlbook/schema"     xmlns:demo="http://www.it315.org/demo/schema"    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"    xsi:schemaLocation="http://www.it315.org/xmlbook/schema                 http://www.it315.org/xmlbook.xsd         http://www.it315.org/demo/schema http://www.it315.org/demo.xsd">    <>        <书名>JavaScript网页开发</书名>        <作者>张孝祥</作者>        <售价 demo:币种=”人民币”>28.00元</售价>    </></书架>

不使用名称空间引入XML Schema文档

文件清单:xmlbook.xml

<?xml version="1.0" encoding="UTF-8"?><书架 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"    xsi:noNamespaceSchemaLocation="xmlbook.xsd">    <>        <书名>JavaScript网页开发</书名>        <作者>张孝祥</作者>        <售价>28.00元</售价>    </></书架>

在XML Schema文档中声明名称空间

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"               targetNamespace="http://www. itcast.cn"               elementFormDefault="qualified"><xs:schema>
  • targetNamespace元素用于指定schema文档中声明的元素属于哪个名称空间。
  • elementFormDefault元素用于指定,该schema文档中声明的根元素及其所有子元素都属于targetNamespace所指定的名称空间。

Xml DTD Schema标准参考手册

http://download.csdn.net/download/cckevincyh/10104341