置标语言

来源:互联网 发布:ftp 的端口号是什么 编辑:程序博客网 时间:2024/04/28 20:00

      对XML感兴趣的你是否熟悉当前在网络上大行其道的超文本置标语言HTML(HyperText Markup Language)呢?是否对HTML背后的“置标”这一概念也有所了解呢?要知道,XML和HTML同属一个大家族——置标语言家族,因此,为了让大家更好地理解XML,我们就首先从HTML讲起。

顾名思义,HTML的精髓在于“置标”(Markup),通俗地讲,它就是一种用来给文本添加标记的语言。那么,“置标”的精确含义究竟是什么呢?

“置标”的一个精确定义是:就数据本身的信息对数据进行编码的方法。是不是这个定义太抽象了?没关系,其实“置标”的概念在现实生活中比比皆是,我们只须看看下面这个例子就明白了。

想必大家都有这样的经历——在上学时,曾经用黄色荧光笔把课本上的某些句子加亮,或者干脆在这些句子下面划线——相信即便你自己没有这样做过,你也见过身边的同学这样做。而之所以要将这些句子用荧光笔加亮,是因为你觉得它们很重要。考试前,这些内容需要复习一下,只要跟着这些加亮标记,你就可以迅速地把它们浏览一遍。事实上,不光是你,世界上成千上万的人都在为同样的理由做同样的事情。

其实,正是通过将这些内容加亮,你已经有效地将它们“置标”。把它们用黄色荧光加亮,表示这些课文很重要。于是乎,关于这些课文的信息——即这些课文很重要这一事实——就这样被编码了。

不仅如此,由于几乎所有人都遵循着和你一样的置标标准(难道你见过专门挑那些不重要的课文加亮的人吗?),当你拿起一本别人的课本随便翻翻时,你只要看看那些作了加亮标记的段落,就可以对这本书的精华略知一二了。

从这个例子中我们可以得到两点启示。当我们需要通过标记将有用的信息告知一组用户时:

  1. 首先,我们必须有一个标准,用它来描述什么是有效的标记。在上面例子中,标记被定义为在文字上的黄色荧光墨水印迹。而在HTML中,标记就是所谓的“标签”(tag)。
  2. 其次,我们还要有一个标准描述每个标记的具体含义。上面例子中的黄色荧光加亮标记意味着被加亮的句子很重要。而在HTML中,每一个标签都表明了一种显示的格式。

同样,“置标”的应用在计算机世界中也甚为广泛。文字编辑器借助置标来定义格式与外观,通信程序依靠置标来理解线路上所传输的信息的语意,数据库通过置标来将数据字段与一定的含义相连,并表明字段之间的关系,多媒体应用中置标则用来标示什么是图象和声音的源数据。

当这些数据被传送给计算机或应用程序时,它必须自身携带一些必要的信息,以表明这些数据的含义,以及接收者应该如何处理这些数据。

可以想象,到了考试期间,如果你的课本上没有任何重点标记,你只能对着它望洋兴叹。同样,如果数据中不带有任何背景信息,应用程序也只能对它望洋兴叹!

HTML就是众多著名的计算机置标系统中的一个。它描述了一系列标签,每个标签表明了一定的显示格式。被置标后的文件(即同时包含了纯文本和关于文本显示格式的标签的文件)由一个HTML处理工具,譬如一个浏览器,进行读取,然后再根据上述标记规则来加以显示。

最后,让我们通过一个例子来看看HTML中的置标是如何大显神通的。在HTML中,标签〈B〉的含义是要求HTML浏览器将一段文本加粗表示,而标签〈CENTER〉的含义是告诉浏览器将这段文本在一行的中间显示。所以,在浏览器中,〈CENTER〉〈B〉BOLD〈/B〉〈/CENTER〉是如下显示的:

BOLD

同样,下面这一段HTML代码显示了一个客户联系信息列表:

<UL>
<LI>张三</LI>
<UL>
<LI>用户ID: 001</LI>
<LI>公司: A公司</LI>
<LI>EMAIL: zhang@aaa.com</LI>
<LI>电话: (010)62345678</LI>
<LI>地址: 五街1234号</LI>
<LI>城市: 北京市</LI>
<LI>省份: 北京</LI>
<LI>ZIP: 100001</LI>
</UL>

<LI>李四</LI>
<UL>
<LI>ID: 002</LI>
<LI>公司: B公司</LI>
<LI>EMAIL: li@bbb.org</LI>
<LI>电话: (021)87654321</LI>
<LI>地址: 南京路9876号</LI>
<LI>城市: 上海市</LI>
<LI>省份: 上海</LI>
<LI>ZIP: 200002</LI>
</UL>
</UL>

这段HTML置标数据在浏览器中的显示效果如下:

  • 张三
    • 用户ID: 001
    • 公司: A公司
    • EMAIL: zhang@aaa.com
    • 电话: (010)62345678
    • 地址: 五街1234号
    • 城市: 北京市
    • 省份: 北京
    • ZIP: 100001
  • 李四
    • ID: 002
    • 公司: B公司
    • EMAIL: li@bbb.org
    • 电话: (021)87654321
    • 地址: 南京路9876号
    • 城市: 上海市
    • 省份: 上海
    • ZIP: 200002

当我们对“置标”的含义有了一个明确的理解后,我们对XML的精髓就已经掌握了一半。那么,置标在HTML中的形式和作用与在XML中的形式和作用又有什么不同呢?下一节我们来讨论这个问题。

原创粉丝点击