xml文档的DTD约束和Schema约束

来源:互联网 发布:win1p虚拟机mac上网 编辑:程序博客网 时间:2024/05/07 19:36
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。XML的约束模式有两种,一种是DTD,还有一种就是Schema。
一、DTD约束(语法简单,功能简单)
二、Schema约束(语法复杂,功能强大)



一、DTD约束

文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合b法的元素来定义文档的结构。
文档类型定义可被成行地声明于标准通用标记语言、可扩展标记语言文档中,也可作为一个外部引用。


(一)声明

1、内部的 DOCTYPE 声明

<!DOCTYPE note[    <!ELEMENT note(heading,body)>    <!ELEMENT heading  (#PCDATA)>    <!ELEMENT body     (#PCDATA)>]><!--!ELEMENT note(heading,body)定义 note 元素有四个元素:heading,、body,并且按照顺序、次数排列。!ELEMENT heading  (#PCDATA)定义 heading 元素为 "#PCDATA" 类型!ELEMENT body     (#PCDATA)定义 body 元素为 "#PCDATA" 类型-->


2、外部文档声明
(1)本地文件系统导入

<!DOCTYPE rootElt SYSTEM "constrain.dtd"><!--格式为:<!DOCTYPE 根元素 SYSTEM "约束文件名">-->


(2)公共的外部导入

<!DOCTYPE hibernate-configuration PUBLIC             "-//Hibernate/Hibernate Configuration DTD 3.0//EN"             "http://hibernate.sourceforge.net/hibernate-configuration-3.0.dtd">  <!--          格式为:<!DOCTYPE 根标签 PUBLIC "约束文件url">-->



(二)DTD-元素

在一个 DTD 中,元素通过元素声明来进行声明。

<!ELEMENT rootElt (subElt1+,subElt2*,subElt3?,(subElt4|subElt5))><!ELEMENT subElt1 EMPTY><!ELEMENT subElt2 (#PCDATA)><!ELEMENT subElt2 ANY><!--下面为合法xml格式--><rootElt>    <subElt1></subElt1>    <subElt1></subElt1>    <subElt1></subElt1>    <subElt3>any</subElt3>    <subElt4><grand></grand></subElt4></rootElt><!--元素约束格式:    <!ELEMENT 标签名字 类别> 或者 <!ELEMENT 标签名字 (标签内容)>类别:    1、空标签: EMPTY 表示标签是空标签    2、普通字符串: (#PCDATA) 表示标签内容一定是普通字符串    3、带有任何内容的标签: ANY 表示标签的可以是任何内容标签内容:    1、解决子标签出现顺序问题:        <!ELEMENT 父元素 (子元素1,子元素2,子元素3)>        那么父元素,必定要包含 子元素1,子元素2,子元素3 ,并且一定要按照该顺序排列    2、解决子标签出现次数问题:        <!ELEMENT 父元素 (子元素1+,子元素2*,子元素3?)>        这里除了子元素顺序问题。还有包含着子元素的后面跟着的符号        + 表明子元素1可以出现1次或者多次        * 表明子元素2可以出现0次或者多次        ? 表明子元素3可以出现0次或者1次    3、解决子标签不确定问题:        <!ELEMENT 父元素 (子元素1,(子元素2|子元素3))>        表明该父元素,一定要包含子元素1,子元素2或子元素3。-->


(三)DTD-属性

在 DTD 中,属性通过 ATTLIST 声明来进行声明。

<!ELEMENT elt EMPTY><!ATTLIST elt name CDATA "nameless"><!ATTLIST elt gender (women|men) #REQUIRED><!ATTLIST elt id ID><!ATTLIST elt alias CDATA #IMPLIED><!ATTLIST elt specis CDATA #FIXED "human"><!--下面为合法xml格式--><elt name="lee" gender="man" id="elt1" specis="huamn" /><!--下面为不合法xml格式    1、缺少name属性    2、gender属性的值不是枚举中的任何一个    3、ID类型的id属性,值不能以数字开头    4、specis属性值时固定的--><elt gender="ladybody" id="1" specis="animal"><!--属性约束格式:    <!ATTLIST 元素名称 属性名称 属性类型 默认值>属性类型:    CDATA   值为字符数据 (character data)    (en1|en2|..)    此值是枚举列表中的一个值    ID  值为唯一的 id    IDREF   值为另外一个元素的 id    IDREFS  值为其他 id 的列表    NMTOKEN 值为合法的 XML 名称    NMTOKENS    值为合法的 XML 名称的列表    ENTITY  值是一个实体    ENTITIES    值是一个实体列表    NOTATION    此值是符号的名称    xml:    值是一个预定义的 XML 值默认值:    #REQUIRED 属性值时必需的    #IMPLIED  属性不是必需的    #FIXED "value" 属性不是必需的,但属性值是固定的-->


更多关于DTD约束内容…




二、Schema约束

可扩展标记语言架构是以可扩展标记语言(例如XML)为基础的,它用于可替代文档类型定义(DTD);一份XML schema文件描述了可扩展标记语言文档的结构。
1、XML Schema 是基于 XML 的 DTD 替代者。
2、XML Schema 描述 XML 文档的结构。
3、XML Schema 语言也称作 XML Schema 定义(XML Schema Definition,XSD)。


(一)简单的类型

1、xsd 元素
简单元素指那些仅包含文本的元素。它不会包含任何其他的元素或者属性。(也可以像数据类型添加限定,以此来限制它的内容)

<xs:element name="Name" type="xs:string"><xs:element name="Age" type="integer"><xs:element name="gender" type="" default="man"><xs:element name="specis" type="xs:string" fixed="human"><!--定义简易元素的格式:    <xs:element name="元素名称" type="元素的数据类型"/>元素的数据类型:    xs:string 字符串类型    xs:decimal 浮点数类型    xs:integer 整数类型    xs:boolean 布尔类型    xs:date 日期类型    xs:time 时间类型默认值和固定值     default 当没有其他值被规定时,默认值就会自动分配给元素    fixed 固定值会自动分配给元素,而且无法规定另外的值-->


2、xsd 属性
某个元素拥有属性则是复杂的类型。但是属性本身作为简易类型被声明。。

<xs:attribute name="id" type="integer"><!--定义属性的格式为:    <xs:attribute name="属性名称" type="属性的数据类型" />属性的数据类型:    xs:string 字符串类型    xs:decimal 浮点数类型    xs:integer 整数类型    xs:boolean 布尔类型    xs:date 日期类型    xs:time 时间类型默认值和固定值     default 当没有其他值被规定时,默认值就会自动分配给元素    fixed 固定值会自动分配给元素,而且无法规定另外的值-->


3、xsd限定

<!--    1、对值的限定    下面的例子定义带有限定且名为age的元素。age值不能低于0,不能高于120。--><xs:element name="age"><xs:simpleType>    <xs:restriction base="xs:integer">        <xs:minInclusive value="0"/>        <xs:maxInclusive value="120"/>    </xs:restriction></xssimpleType></xs:element><!--    2、限定为某一枚举类    下面的例子,把xml元素限定为一组枚举类。元素gender的内容只能是man和woman。--><xs:element name="gender"><xs:simpleType>    <xs:restriction base="xs:string">        <xs:enumeration value="man"/>        <xs:enumeration value="woman"/>    <xs:restriction></xs:simpleType><xs:element>



(二)复杂的类型

复合元素指包含其他元素或者换属性的xml元素。四种类型复合元素:
1、空元素
2、包含其他元素的元素
3、仅包含文本的元素
4、包含元素和文本的元素
0 0
原创粉丝点击