JAVA Web开发之XML基础和DTD约束

来源:互联网 发布:星光大道网络报名方式 编辑:程序博客网 时间:2024/05/16 05:42

xml笔记:
Extensible Markup Language,翻译过来为可扩展标记语言。Xml技术是w3c组织发布的,目前推荐遵循的是W3C组织于2000发布的XML1.0规范。 

XML技术除用于保存有关系的数据之外,它还经常用作软件配置文件,以描述程序模块之间的关系。
Xml文件中的注释采用:“<!--注释-->” 格式。
命名规范:
一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:
区分大小写,例如,<P>和<p>是两个不同的标记。
不能以数字或"_" (下划线)开头。
不能以xml(或XML、或Xml 等)开头。
不能包含空格。
名称中间不能包含冒号(:)。


一个XML文件分为如下几部分内容:
文档声明
元素
属性
注释 
CDATA区 、特殊字符
处理指令(processing instruction)。

利用css展现xml文件:

<?xml version="1.0" encoding="UTF-8"  ?>
<?xml-stylesheet type="text/css" href="config.css" ?>
<soft>
<a>
  <a1>中国</a1>
  <a2>美国</a2>
</a>

<b>
   <b1>日本</b1>
   <b2>英国</b2>
</b>

</soft>


<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

<soft>
<![CDATA[
     <a>
                 <a1>中国</a1>
                 <a2></a2>
     </a>
        ]]>
     <b>
                
                 &lt;b1&gt;&lt;/b1&gt;
                 <b2></b2>
     </b>

</soft>


XML约束:


XML DTD
XML Schema

1.引用DTD约束:
   当引用的文件在本地时,采用如下方式:
  <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
 例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>。在xml文件中手写一下。

   当引用的文件是一个公共的文件时,采用如下方式: 
  <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">

  例如:<!DOCTYPE web-app PUBLIC
  "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"
  "
http://java.sun.com/dtd/web-app_2_3.dtd">

2,元素定义
 如为元素内容:则需要使用()括起来,如
  <!ELEMENT 书架 (书名,作者,售价)>
  <!ELEMENT 书名 (#PCDATA)>
   如为元素类型,则直接书写,DTD规范定义了如下几种类型:
   EMPTY:用于定义空元素,例如<br/> <hr/>
   ANY:表示元素内容为任意类型。

 

在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
  +: 一次或多次 (书+)
   ?: 0次或一次 (书?)
   *: 0次或多次  (书*)
也可使用圆括号( )批量设置,例
 <!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

3.属性定义:

  语法格式:

   <!ATTLIST 元素名
             属性名1 属性值类型  设置说明
             属性名1 属性值类型  设置说明
        .........
   >

 

属性声明举例:
<!ATTLIST 商品
 类别 CDATA #REQUIRED
 颜色 CDATA #IMPLIED
>
对应XML文件:
 <商品 类别="服装" 颜色="黄色">…</商品>
 <商品 类别="服装">…</商品>

 

设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:可以设置也可以不设置
#FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。 


举例:
      <!ATTLIST 页面作者
      姓名 CDATA #IMPLIED
      年龄 CDATA #IMPLIED
      联系信息 CDATA #REQUIRED
      网站职务 CDATA #FIXED "页面作者"
      个人爱好 CDATA "上网"
       >
4.常用属性值类型


   CDATA:表示属性值为普通文本字符串。
   ENUMERATED
   ID
   ENTITY(实体)


(1)属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)

  <?xml version = "1.0" encoding="GB2312" standalone="yes"?>
<!DOCTYPE 购物篮 [
 <!ELEMENT 肉 EMPTY>
 <!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">
]>
<购物篮>
 <肉 品种="鱼肉"/>
 <肉 品种="牛肉"/>
 <肉/>
</购物篮>

(2)实体可分为两种类型:引用实体和参数实体。
引用实体:


语法格式:
<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容
引用方式:
&实体名称;
举例:
 <!ENTITY copyright “I am a programmer">
  ……
  &copyright;

参数实体:

语法格式:
   <!ENTITY % 实体名称 "实体内容" >
引用方式:
%实体名称;
举例1:
  <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
 
    <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>
  <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>
举例2:
<!ENTITY % common.attributes
  " id ID #IMPLIED
 account CDATA #REQUIRED "
>
...
<!ATTLIST purchaseOrder %common.attributes;>
<!ATTLIST item %common.attributes;>


综合案例:

 

 


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE TVSCHEDULE [

<!ELEMENT TVSCHEDULE (CHANNEL+)>
<!ELEMENT CHANNEL (BANNER,DAY+)>
<!ELEMENT BANNER (#PCDATA)>
<!ELEMENT DAY (DATE,(HOLIDAY|PROGRAMSLOT+)+)>
<!ELEMENT HOLIDAY (#PCDATA)>
<!ELEMENT DATE (#PCDATA)>
<!ELEMENT PROGRAMSLOT (TIME,TITLE,DESCRIPTION?)>
<!ELEMENT TIME (#PCDATA)>
<!ELEMENT TITLE (#PCDATA)>
<!ELEMENT DESCRIPTION (#PCDATA)>

<!ATTLIST TVSCHEDULE NAME CDATA #REQUIRED>
<!ATTLIST CHANNEL CHAN CDATA #REQUIRED>
<!ATTLIST PROGRAMSLOT VTR CDATA #IMPLIED>
<!ATTLIST TITLE RATING CDATA #IMPLIED>
<!ATTLIST TITLE LANGUAGE CDATA #IMPLIED>

]>


<TVSCHEDULE NAME="AAA">
  <CHANNEL CHAN="BBB">
     <BANNER></BANNER>
     <DAY>
         <DATE></DATE>        
             <PROGRAMSLOT>
                   <TIME></TIME>
                   <TITLE></TITLE>
                   <DESCRIPTION></DESCRIPTION>
             </PROGRAMSLOT>
     </DAY>
  </CHANNEL>
</TVSCHEDULE>

原创粉丝点击