心得2--XML约束--DTD精讲

来源:互联网 发布:双色球算法必中6红147 编辑:程序博客网 时间:2024/06/10 08:38

1.XML约束概述

l    什么是XML约束

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。

l    为什么需要XML约束

l    常用的约束技术

•       XML DTD

•       XML Schema

2.DTD约束快束入门

l    DTD(Document Type Definition),全称为文档类型定义

文件清单:book.xml

<?xmlversion="1.0" ?>

<!DOCTYPE 书架 SYSTEM "book.dtd">

<书架>

   <书>

      <书名>Java就业培训教程</书名>

      <作者>redarmy</作者>

      <售价>39.00元</售价>

   </书>

   <书>

      <书名>JavaScript网页开发</书名>

      <作者>redarmy</作者>

      <售价>28.00元</售价>

   </书>

</书架>

文件清单:book.dtd

<!ELEMENT书架 (书+)>

   <!ELEMENT 书 (书名,作者,售价)>

   <!ELEMENT 书名 (#PCDATA)>

   <!ELEMENT 作者 (#PCDATA)>

   <!ELEMENT 售价 (#PCDATA)>

DTD文件应使用UTF-8或Unicode

3.编程校验XML文档正确性

l    IE5以上浏览器内置了XML解析工具:Microsort.XMLDOM,开发人员可以编写javascript代码,利用这个解析工具装载xml文件,并对xml文件进行dtd验证。

l    创建xml文档解析器对象

varxmldoc = new ActiveXObject("Microsoft.XMLDOM");

l    开启xml校验

xmldoc.validateOnParse= "true";

l    装载xml文档

xmldoc.load("book.xml");

l    获取错误信息

xmldoc.parseError.reason; 

xmldoc.parseError.line

4.编写DTD约束的两种方式

l    DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。

<?xmlversion="1.0" encoding="UTF-8"standalone="yes"?>

<!DOCTYPE书架 [

   <!ELEMENT 书架 (书+)>  <!-- +号表示书架上有一本或多本书,相当于正则里的+,正则里的问号表示0、多个。-->

   <!ELEMENT 书 (书名,作者,售价)>  <!—这里的逗号表示这三个元素是按顺序出现的,如果这里用空格则表示没顺序。-->  <!ELEMENT 书名 (#PCDATA)>

   <!ELEMENT 作者 (#PCDATA)>

   <!ELEMENT 售价 (#PCDATA)>

]>

<书架>

   <书>

      <书名>Java就业培训教程</书名>

      <作者>redarmy</作者>

      <售价>39.00元</售价>

   </书>

   ...

</书架>

l     XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

当引用的文件在本地时,采用如下方式:

      <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">

   例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>。在xml文件中手写一下。

•       当引用的文件是一个公共的文件时,采用如下方式:

   <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">

      例如:<!DOCTYPE web-app PUBLIC

"-//SunMicrosystems, Inc.//DTD Web Application 2.3//EN"

      "http://java.sun.com/dtd/web-app_2_3.dtd">

   可以不会自己写,但是一定要看得懂!!

5. DTD 的语法细节:元素定义

l    在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:<!ELEMENT 元素名称 元素类型> 元素类型可以是元素内容、或类型;

•       如为元素内容:则需要使用()括起来,如

<!ELEMENT 书架 (书名,作者,售价)>

<!ELEMENT 书名 (#PCDATA)>

元素内容中可以使用如下方式,描述内容的组成关系

•      用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE(TITLE,AUTHOR,EMAIL)>

•       用|分隔,表示任选其一(或),即多个只能出现一个

   <!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>

在元素内容中也可以使用+、*、?等符号表示元素出现的次数:

      +: 一次或多次 (书+)

      ?: 0次或一次 (书?)

      *: 0次或多次  (书*)

也可使用圆括号( )批量设置,例

<!ELEMENT MYFILE((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

•       如为元素类型,则直接书写,DTD规范定义了如下几种类型

•      EMPTY:用于定义空元素,例如<br/> <hr/>

•      ANY:表示元素内容为任意类型。

6.  DTD的语法细节:属性定义

xml文档中的标签属性需通过ATTLIST为其设置属性

l     语法格式:

   <!ATTLIST 元素名

      属性名1 属性值类型 设置说明

      属性名2 属性值类型 设置说明

      ……>

l     属性声明举例:

<!ATTLIST商品

   类别 CDATA #REQUIRED

   颜色 CDATA #IMPLIED>

l     对应XML文件:

   <商品 类别="服装" 颜色="黄色">…</商品>

   <商品 类别="服装">…</商品>

l     设置说明:

•      #REQUIRED:必须设置该属性

•      #IMPLIED:可以设置也可以不设置

•       #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值

•       直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。 

l     举例:

      <!ATTLIST页面作者

        姓名 CDATA #IMPLIED

        年龄 CDATA #IMPLIED

        联系信息 CDATA #REQUIRED

        网站职务 CDATA #FIXED"页面作者"

        个人爱好 CDATA "上网"

       >

7.常用属性值类型

l    CDATA:表示属性值为普通文本字符串

l    ENUMERATED (枚举)

l    ID

l    ENTITY(实体)

属性值类型  ENUMERATED

l    属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举),例子:

<?xmlversion = "1.0" encoding="GB2312"standalone="yes"?>

<!DOCTYPE购物篮 [

<!ELEMENT 肉 EMPTY>

<!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">

]>

<购物篮>

<肉 品种="鱼肉"/>

<肉 品种="牛肉"/>

<肉/>

</购物篮>

属性值类型  ID

l    表示属性的设置值为一个唯一值。

l    ID 属性的值只能由字母,下划线开始,不能出现空白字符

<?xmlversion = "1.0" encoding="GB2312" ?>

<!DOCTYPE联系人列表[

   <!ELEMENT 联系人列表 ANY>

   <!ELEMENT 联系人(姓名,EMAIL)>

   <!ELEMENT 姓名(#PCDATA)>

   <!ELEMENT EMAIL(#PCDATA)>

   <!ATTLIST 联系人 编号 ID #REQUIRED>

]>

 

<联系人列表>

   <联系人 编号="1">

      <姓名>张三</姓名>

      <EMAIL>zhang@it315.org</EMAIL>

     </联系人>

   <联系人 编号="2">

      <姓名>李四</姓名>

      <EMAIL>li@it315.org</EMAIL>

   </联系人>

</联系人列表>

实体定义 

l    实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。

l    在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。

l    实体可分为两种类型:引用实体和参数实体。

l    引用实体主要在 XML 文档中被应用

l    语法格式:

<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容

l    引用方式:&实体名称;

l    举例:

   <!ENTITY copyright “I am aprogrammer">

    ……

    &copyright;

l    另一种方式:<!ENTITY 实体名称 SYSTEM “外部XML文档的URL” >:用一个文档所实体 

l    实体定义:参数实体 

l    参数实体被 DTD 文件自身使用

l     语法格式:

   <!ENTITY % 实体名称 "实体内容">

l     引用方式:

%实体名称;

l    举例1:

    <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">

    <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>

    <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>

l    举例2:

<!ENTITY% common.attributes

    "id ID #IMPLIED

   account CDATA #REQUIRED "

<!ATTLISTpurchaseOrder %common.attributes;>

<!ATTLISTitem %common.attributes;>

8. 综合案例:

(1)<?xmlversion="1.0"encoding="UTF-8"?>

<!--设计一个xml格式的文件,该文件能够表达出一个国家中的每个省及省长名称,每个省下面的每个市及市长名称,每个市下面的每个镇及镇长名称。 -->

<!DOCTYPEcountry[

<!ELEMENTcountry (capital,province+)>

<!ELEMENTcaptial (#PCDATA)>

<!ELEMENTprovince (province_captital|city+)>

<!ELEMENTprovince_captital (#PCDATA)>

<!ELEMENTcity (town+)>

<!ELEMENTtown (village+,town_mayor)>

<!ELEMENTvillage (#PCDATA)>

<!ELEMENTtown_mayor (#PCDATA)>

 

<!ATTLISTcountry chairman CDATA#FIXED "杨凯">

<!ATTLISTcapital capitaler CDATA#REQUIRED>

<!ATTLISTprovince provincer CDATA #REQUIRED>

<!ATTLISTprovince_captital pc CDATA #REQUIRED>

<!ATTLISTprovince name CDATA#REQUIRED>

<!ATTLISTcity city_mayor CDATA#IMPLIED>

<!ATTLISTcity name CDATA#REQUIRED>

<!ATTLISTcity age CDATA"100">

]>

 

<country>

   <capital capitaler="yangkai"></capital>

   <province provincer="yang"name="河南">

      <province_captitalpc="郑州"></province_captital>

   </province>

   <province provincer="kai"name="河北">

      <city name="邢台">

        <town>

           <village>沙河</village>

           <town_mayor>&lt;杨凯&gt;</town_mayor>

        </town>

      </city>

      <city name="保定">

        <town>

           <village></village>

           <town_mayor>杨凯</town_mayor>

        </town>

      </city>

   </province>

</country>

 

(2<?xmlversion="1.0"encoding="UTF-8"?>

<!DOCTYPENEWSPAPER [

 

<!ELEMENTNEWSPAPER (ARTICLE+)>

<!ELEMENTARTICLE (HEADLINE,BYLINE,LEAD,BODY,NOTES)>

<!ELEMENTHEADLINE (#PCDATA)>

<!ELEMENTBYLINE (#PCDATA)>

<!ELEMENTLEAD (#PCDATA)>

<!ELEMENTBODY (#PCDATA)>

<!ELEMENTNOTES (#PCDATA)>

 

<!ATTLISTARTICLE AUTHOR CDATA#REQUIRED>

<!ATTLISTARTICLE EDITOR CDATA#IMPLIED>

<!ATTLISTARTICLE DATE CDATA#IMPLIED>

<!ATTLISTARTICLE EDITION CDATA#IMPLIED>

 

<!ENTITYNEWSPAPER "VervetLogic Times">

<!ENTITYPUBLISHER "VervetLogic Press">

<!ENTITYCOPYRIGHT "Copyright1998 Vervet Logic Press">

 

]>

 

<NESPAPER>

   <ARTICLE AUTHOR="nn">

      <HEADLINE></HEADLINE>

      <BYLINE></BYLINE>

      <LEAD></LEAD>

      <BODY></BODY>

      <NOTES></NOTES>

   </ARTICLE>

   <ARTICLE AUTHOR="nn"EDITOR="&PUBLISHER;"DATE="&COPYRIGHT;"EDITION="">

      <HEADLINE>&NEWSPAPER;</HEADLINE>

      <BYLINE></BYLINE>

      <LEAD></LEAD>

      <BODY></BODY>

      <NOTES></NOTES>

   </ARTICLE>

</NESPAPER>

 

原创粉丝点击