xml schema

来源:互联网 发布:js在线阅读本地pdf 编辑:程序博客网 时间:2024/04/27 08:11

xml schema

关键词: xml    schema                                          

 

xml schema的基础知识最好的教材就是w3c的
http://www.w3.org/TR/xmlschema-0

这个网页上讲到的东西如果掌握了,基本上都能够对实际中所有遇到的xmlInstance进行schema约束。

下面说一些理解schema过程中遇到的一些稍微费解的地方:
1。targetNamespace
          schema规范中定义了一些基本的数据类型,比如我们经常用到simpleType的string, float, date,,,这些基本类型, 还有complexType的anyType。这些type的namespace都是标准的http://www.w3.org/2001/XMLSchema, 如果想要使用shema的基本类型, 就必须加上这个Namespace,  实际中往往要定义自己的simpleType和complexType, 而为了把自定义的type跟schema类型分开, 使用targetNamespace即可指定自定义的type的namespace, 而targetnamespace的值往往是异于http://www.w3.org/2001/XMLSchema的。
          在设计schema的时候,通常都需要引入http://www.w3.org/2001/XMLSchema即shema的标准namespace, 如果需要使用其它已经存在的schema的一些类型, 那么就同样需要引入对应的namespace, 也就是被引入的schema中指定的targetNamespace的值。

2。elementFormDefault
                    schema中可以定义全局的element, 比如:
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://schema" xmlns:ns="http://schema">
        <xs:element name="a" type="ns:c"/>
 <xs:complexType name="c">
  <xs:sequence>
   <xs:element name="d" type="xs:boolean"/>
  </xs:sequence>
 </xs:complexType>
<xs:schema>
a就是一个全局的elemnt,   还有一些element是定义在complexType里边的,比如
     
c里边的element d就是一个局部的element.
全局element和局部的element一个很大的不同是:
全局变量a具有namespace "http://schema",而局部变量d的namespace为"".
所以下面的xml instance是错误的,
<a xmlns="http://schema">
 <d>true</d>
</a>


<a xmlns="http://schema">
 <d xmlns="">true</d>
</a>
就是对的。
这一定让很多刚开始学习schema的人感到不知所措。
事实上,实际中我们用得更多的是前面一个xml instance,但是它就是不能通过上面的shema的校验。既然习惯用前一个xml instance, 那么就当然需要修改schema的定义使得校验能够通过。
怎么修改:
两个方法:
1)
<xs:complexType name="c">
 <xs:sequence>
  <xs:element name="d" type="xs:boolean" form="qualified"/>
 </xs:sequence>
</xs:complexType>
在d上加一个form="qualified", 这样d也具有namespace "http://schema"
2)在schema的属性上加上elementFormDefault="qualified"
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" targetNamespace="http://schema" xmlns:ns="http://schema" elementFormDefault="qualified">

3。schema import
现实中会遇到一些比较复杂xml, 比如
<?xml version="1.0" encoding="UTF-8"?>
<a xmlns="http://schema1" xmlns:edi="http://ccc.cc">
 <b edi:attr1="123" attr2="1.112">qwe</b>
 <edi:a>
  <d>false</d>
 </edi:a>
</a>
这个xml复杂的地方在于element a的namespace跟它下面的子元素的<edi:a>的namespace不同,element b的attribute中又含有edi:attr1。那么这个xml怎么来用schema来对它进行约束?
答案是,需要用到schema import的功能。
也即需要编写两个schema文件,其中一个用来对element a,b来进行约束,targetNamespace为"http://schema1", 另外一个schema对<edi:a>, <edi:attr1>来进行约束, targetNamespace为"http://ccc.cc", 前面的schema由于需要用到后面的schema, 所以需要将后者import。

schema1.xsd如下:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema targetNamespace="http://schema1" elementFormDefault="qualified" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:edi="http://ccc.cc" xmlns:schema1="http://schema1">
 <xs:import namespace="http://ccc.cc" schemaLocation="edi.xsd"/>
 <xs:element name="a">
  <xs:complexType>
   <xs:sequence>
    <xs:element name="b">
     <xs:complexType>
      <xs:simpleContent>
       <xs:extension base="xs:string">
        <xs:attribute ref="edi:attr1"/>
        <xs:attribute name="attr2" type="xs:float"/>
       </xs:extension>
      </xs:simpleContent>
     </xs:complexType>
    </xs:element>
    <xs:element ref="edi:a"/>
   </xs:sequence>
  </xs:complexType>
 </xs:element>
 <xs:element name="d" type="xs:boolean"/>
</xs:schema>


edi.xsd如下:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema targetNamespace="http://ccc.cc" elementFormDefault="qualified" attributeFormDefault="unqualified" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:ns1="http://schema1">
 <xs:import namespace="http://schema1" schemaLocation="schema1.xsd"/>
 <xs:element name="a">
  <xs:complexType>
   <xs:sequence>
    <xs:element ref="ns1:d"/>
   </xs:sequence>
  </xs:complexType>
 </xs:element>
 <xs:attribute name="attr1">
  <xs:simpleType>
   <xs:restriction base="xs:string">
    <xs:maxLength value="3"/>
   </xs:restriction>
  </xs:simpleType>
 </xs:attribute>
</xs:schema>

 
原创粉丝点击