知识图谱介绍

来源:互联网 发布:一句话一个故事 知乎 编辑:程序博客网 时间:2024/06/07 03:19

前言

看到这个名词,首先抓到的是“图”,知识图谱的数据结构应该是图。当时我就好奇知识图谱是干什么的,于是这两天查阅了一些资料,总结凝炼写成博文,供以后翻阅。

知识图谱是什么?

知识图谱是一个图结构,是一个知识网络,知识图谱旨在描述真实世界中存在的各种实体或概念,图中节点代表实体,边表示”关系”(relation)或者”属性”(attribute)。每个属性-值对(attribute-value pair,又称AVP)用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。可以举例如下:
杨幂(实体1)–老公(属性)–刘恺威(实体2)
当然,现实中用到的知识图谱肯定不是这么简单,国际上流行的知识库包含关系的数量级是亿级,所以真实的知识图谱可能是以下样子:
这里写图片描述

进一步理解知识图谱,可以看一下它在搜索中的应用。打开百bing搜索姚明身高,得到以下结果:
这里写图片描述

学过信息检索,检索返回结果原本是按相似度排序的网页,类似与下列页面(图片来自网络)
这里写图片描述

对比可以看出知识图谱为搜索提供了一个更直观的反馈。反馈给用户一个知识卡片,卡片上直接展示了姚明的身高、简介及更多相关信息。知识图谱出现的背景是互联网逐步从仅包含网页与网页之间超链接的文档万维网转变为包含大量描述各种实体和实体之间丰富关系的数据万维网。对比传统的搜索引擎和知识图谱的变化有以下三点:
1.信息抽取目标发生了变化,传统的文本指定抽取(ACE)=>海量数据的发现(KBP);
2.从文本分析为核心转变成了知识发现为核心;
3.让计算机真正理解用户的查询需求,给出准确答案而不是给出相关的链接序列;

知识图谱构建过程