语义网基础教程 (第一版)2 XML结构化网络文档

来源:互联网 发布:linux 避免别人误删 编辑:程序博客网 时间:2024/06/10 02:05

第2章 XML结构化网络文档

      HTML源于SGML(标准通用标记语言),是目前书写网页的标准语言,定义一种独立于设备和系统且人机均可读的信息表示方法。引入它的原因是SGML对于和因特网相关的某些用途过于复杂。为了克服HTML的一些缺陷,另一种SGML应用-XML(可扩展性标记语言)应运而生。

<book>    <title>  You  </title>    <author> V.Marek </author>    <publisher>Spinger</publisher>    <year>1993</year>    <ISBN>038291384</ISBN></book>

      在很多领域中,人们已经定义了这种基于XML的应用,比如数学领域(MathML)、生物信息领域(BSML)、人力资源领域(HRML)、天文学领域(AML)、新闻领域(NewsML)和投资领域(IRML)。同样,W3C也在XML上定义了多种语言,比如SVG和SMIL。这种方法也应用于定义RDF。

XML语言

     一个XML文档包含一个序言、一系列元素和一个可选的尾注。


结构化

       有两种定义XML文档结构的方式:DTD方式和XML Schema方式。

XML文档的寻址和查询

       XML查询语言的核心概念是路径表达式,它规定如何在XML文档的树形表示中到达一个节点或一个节点集。

       XPath是一种对XML文档的组件(parts)进行寻址的语言,它对XML的树形数据模型进行操作,并具有一种非XML语法。关键概念是路径表达式。XPath的路径表达式可为:绝对的和相对的。

处理







原创粉丝点击