XML的基本语法

来源:互联网 发布:第五届厦门网络文化节 编辑:程序博客网 时间:2024/04/28 11:24

XML的基本语法

1.文档声明
     (1)最简单的声明语法:
        <?xml version="1.0" ?>
     (2)用encoding属性说明文档的字符编码
        <?xml version="2.0" encoding="GB2312" ?>
     (3)用standalone属性说明文档是否独立:
        <?xml version="1.0" encoding="GB2312" standalone="yes" ?>

2.元素定义
     (1)一个XML元素由一个标记来定义,包括开始和结束标记以及其中的内容,例如:
        <书名>JAVA详解</书名>
     (2)一个元素中可以嵌套若干子元素。
     (3)格式良好的XML文档必须有且仅有一个根元素,其他元素都是这个根元素的子孙元素。
     (4)空元素可以不使用结束标记,但必须在起始标记的结束定界符(>)前面增加一个正斜杠(/),例如:
        <img src="logon.jpg" />
     (5)所有的元素都必须合理的嵌套,绝对不允许标签交叉,例如:
        <b>sdfsdeee<i>sdfsdf</b></i>
     (6)元素的标记名称规范
 
3.属性定义
     (1)一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如:
       <售价 单位="元">58</售价>
     (2)属性值一定要用双引号(")或单引号(')引起来
     (3)属性遵循与标签相同的命名规范
     (4)属性可以被改成用子元素来描述同样的信息
         <售价>
              <单位>元</单位>
              <价格>58</价格>
        </售价>

4.注释
     (1)用“<!--注释-->”正中格式加入注释
     (2)用XML声明之前不能有注释
     (3)一对注释符号之中不能包含另一对注释符号。

5.空格和换行的处理
     (1)对于XML中的标签以外的所有空格和换行,XML解析程序都要一个个如实地交给下游程序去处理。

6.CDATA区
     (1)XML文档中包含类似"Elemets look like <this>"的文本,其中的"this"将解析程序解释成一个元素,而人们实际想要的是"<this>"所表示的原义文本。
     (2)CDATA全称为character data,以“<![CDATA[”开始,以“]]>”结束,在两者之间嵌入不想被解析程序解析的原始数据,解析器不对CDATA区中的内容进行解析,而是将这些数据原封不动地交给下游程序去处理。

7.特殊字符
     (1)&转成&amp;<转成&lt;>转成&gt;"转成&quot;'转成&apos;

8.处理指令
     (1)处理指令是processing instruction的中文翻译,通常简称PI,用来为处理XML文档的应用程序提供指示信息。
     (2)处理指令以"<?"作为开头,以"?>"作为结尾,XML声明语句就是最常见的一种处理指令。
     (3)XML分析器把处理指令原封不动地传给应用程序,由应用程序来解析这个指令,按照它所提供的信息来进行处理。例如,在某个XML文档中可以包含下面的语句来告诉浏览器使用book.css控制其显示效果:
          <?xml-stylesheet type="text/css" href="book.css" ?>