OWL相关概念

来源:互联网 发布:聚合数据姓名验证 编辑:程序博客网 时间:2024/06/10 22:49

http://hi.baidu.com/xiebh_ty/blog/item/5d09a038f0fb85f7b311c770.html    

请先理解RDF和RDF Schema的知识在看这篇文章。不理解的话请本站参照RDF和RDF Schema在线手册的第一篇相关概念的文章。理解概念很重要,因为对大多数人来说都有编程的基础,可以直接看别的语言的代码。但语义网相关概念是比较新 的概念。所以建议把概念一定到搞懂。通过RDF Schema,我们可以自定义词汇了。但在我们的实际生活当中,我们用的词汇直接,都是有联系的。最简单的反义词,同义词。又比如"足球队"这个词,我们 每个人脑子都有一个概念,上场比赛需要11个队员。这都是我们在生活中积累的经验。我们想让机器也理解数据的话,最起码要和人一样,也可以定义反义词,同 义词,或者词和词之间的一些关系。这些仅仅靠RDF和RDF Schema是不够的。为了达到这个要求,就有了OWL(Web Ontology Language)的出现,Ontolory本是哲学词汇--存在论的意思。大多数中文翻译为本论。其实用原本哲学的意思就很好理解。我们就是在定义词 汇,或者词汇直接的关系,或者类之间的关系等等。我们定义了它们,它们就存在于我们的网络里了。我们看看有了它对我们到底有什么好处。比如说它可以定义类 和类之间的关系,等价性,互补排斥性,限制个数,属性的对称性等等。似乎还比较模糊,那就举一个具体的例子,比如我们描述这样一个资源:从北京到上海的距 离400公里。人们听到了这句话后就知道了,上海到北京也是400公里。因为我们知道起点北京到终点上海的距离,和起点上海到终点北京的距离是一样的,也 就是我们懂距离,起点,终点这3个词的概念而且知道它们之间的关系,所以我们得出上面的结论。现在我们可以用RDF和RDF Schema来定义这3个词汇,然后我们需要定义的是一个关系,起点-终点的距离等于终点-起点的距离,这里运用到了等价性。这个关系不能用RDF和 RDF Schema来定义,但是可以通过OWL来定义。当然解决这个问题方法可以有许多定义,我只是在这里举个例子。大家应该大概知道OWL是做什么的吧。那么 为什么它有这个功能呢?其实它运用了人工智能中的逻辑论,逻辑论把人们的思维用式子来表达,并且可以证明这个式子的正确。其实在语义网的定义中,吸收了很 多知识的优点,面向对象,逻辑轮,树结构等等。所以大家学起来,有时会有似曾相识的感觉。下面把大家容易混淆的几个概念XML,XML Schema,RDF,RDF Schema,OWL直接的关系拿出来讲一下。
主要的理解思想就是在语义网的定义中遇到问题了,就会有新的事物被定义或者说是出现


从HTML到XML


HTML的记述是我们最常用的,本来它是用来描述资源的,但是它记录的只有人可以看懂。还有它第一结构不明显,很难被应用程序解析,第二,记述的 局限性,比如某些科学符号无法表达等等。为了让应用程序好理解,就需要有良好的结构。最简单但也是功能很强大的树状结构就被采用了。我们以树状结构来记录 数据,这就是XML。XML:是一种国际通用标记语言。它为在各种应用程序间的数据和meta数据的交换,提供了一致的体系和解析器(praser)。但 是对于数据的意义没有进行定义,比如说对于某个标签< 课程>,也就是本身没有意义,除了结构的不同,它和HTML一样,数据也只有人可以看懂。想让机器理解数据,首先本身的数据类型很重要,不然自己都 不知道自己是谁,或者自己是干什么的,怎么可能让机器理解。为了更好的描述资源,也就是说为了更准确的纪录数据的类型。需要我们可以自定义类型,因为预定 义的类型只有最基本的类型,不能定义大多数现实生活中的数据类型。对于数据发布人,需要他描述清楚数据类型,也就是说数据的限制等等。所以我们需要一个可 以在预定义类型上可以自定义类型,而且它也必须能被解析器解析。所以,就出现了XML Schema。
XML Schema
XML Schema:XML的定义机制。和DTD文档类型定义不同,不需要另外的解析器和编辑器。定义的是XML的构造,对已有的类型进行扩张或者进行制约,从 而定义了新的类型。XML Schema提供了在XML可以利用的基本的数据类型(日期,数值等,DTD中只提供了文字列)。但是即便是这样,它只是对XML文档的构造进行了定义, 还是不能让应用程序理解数据。所以为了实现应用程序理解数据,就出现了RDF。
从XML到RDF
RDF有时我们会称它为语言,其实这是不对的,RDF是一种书写规范,正确的翻译为资源描述框架。RDF的基本构造为陈述(或者叫做声明, statement)了一个资源-资源具有的属性-属性值(主体-属性-客体)的三元组。它表现的是一个数据模型,通俗的说一个陈述就是一个什么事物(资 源)具有什么属性(属性),这个属性是怎样的属性(属性值)。我们为了描述抽象的数据模型,需要具体的书写,这就用到了XML,这样RDF就继承了XML 的优点。但是不用XML的构成,利用其他的构成也可以表现RDF。所以对RDF而言,XML不是必要的(一般我们的文档格式为RDF/XML就是这个原 因,用XML表示的RDF)。我们终于可以定义一个让机器理解的词汇了,但是它也遇到了一个问题,就是预定义的词汇根本不够用。我们需要自定义一些词汇。 为了可以自定义词汇,就出现了RDF Schema。
RDF Schema
RDF Schema (RDFS)翻译为资源描述框架的定义机制,大家也许会比较容易联想到XML和XML Schema的关系,认为它们是同样的。这个想法也是不对的,XML Schema是用来对XML的构造进行定义,而RDFS是用来对RDF数据模型用到的词汇进行定义。我们需要了解一个RDF的特征,它是以属性为中心的思 考方法。不是具体定义属性的值,而是定义了拥有这个属性的主体(资源)的范围(定义域),和这个属性可以取到的值的范围(值域)。这样就我们可以比较精确 地定义词汇。为什么说比较精确,而不说精确,因为一个单独存在的词汇对我们毫无意义,即便机器可以理解它。我们语言中的词汇都是互相有关联的,正因为我们 只有知道了词汇的相互关系,我们才可以在生活中正常交流。同样我们一直说让应用程序理解词汇,其实是为了让应用程序理解词汇以及词汇之间的关系,从而自动 地,智能地提供给我们服务。为了达到这个目的,描述词汇的关系至关重要。但是RDF和RDF Schema却不能提供给我们这样一个功能,所以也就出现了OWL。
OWL
OWL是RDF的扩张,提供我们更广泛的由定义RDF Schema词汇。所谓更广泛就是指可以定义词汇之间的关系,类与类的关系,属性与属性之间的关系等等。具体请参照本站的在线使用手册。
后记
其实每个概念都不难理解,理解的关键在于它们为了什么而出现。OWL的出现也没有能实现最终的目的。所以语义网结构上还有几层,这几层还没有推出规范,所以暂时不做它们的使用手册。不过我会在博客中陆续介绍它们的进展情况。

原创粉丝点击