如何理解RDF?

来源:互联网 发布:网络管理与维护论文 编辑:程序博客网 时间:2024/06/07 03:32
作者:顾轶灵
链接:https://www.zhihu.com/question/28706033/answer/41818511
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

万维网是一个描述资源资源之间关系的网络。

RDF(Resource Description Framework)从名字就可以看出来,是一种描述资源的方式。简单来说每一条描述都是一个主谓宾三元组构成的短句,比如:
{ 苹果, 是, 公司 }, { 库克, 是, 人 }, { 苹果, CEO 是, 库克 }
把它画成 RDF 图就是你说的两点一线的样子。

在这个例子里,我们有越多这样的三元组,就等于我们有越多关于苹果公司的知识
为什么要这么组织呢?因为你要直接说「苹果公司的 CEO 是个叫库克的人」,计算机就凌乱了啊,因为自然语言包含太多的不确定性。比如这里就有:苹果公司是一家叫苹果的公司还是这是一家卖苹果的公司?按三元组的方式,计算机每次就能记录一条简单明确的知识了。

这里还有一个要处理的是三元组本身的歧义:哪天又输入了一条 { 苹果, 是, 水果 },那怎么办?这和我们之前的苹果不是一个货啊。我们描述的用词本身不能有歧义,有什么唯一表示的方法么?答案就是用 URI(Universal Resource Identifier)。一旦确定每个东西都有唯一表述方式,那么 RDF 三元组的形式就是 { URI, URI, URI } 了。

有了许多这样的三元组以后,我们就可以得到一个知识网。把多个这样的网放在一起,所有相同 URI 的节点都可以合并到一起,逐渐组成一张大网——可以说是语义网的雏形。里面所有的内容都是机器可查询、标准且无歧义的,于是我们就可以根据现有知识进行简单的计算和推理,得到隐含的新知识。

原创粉丝点击