知识图构建--论文研读

来源:互联网 发布:电子白板软件下载 编辑:程序博客网 时间:2024/06/05 01:01

知识图谱——论文研读

《基于图数据库的电影知识图谱应用研究》

作者:陆晓华, 张宇, 钱进.

①  知识图谱是一种基于图的数据结构,由节点和边组成,其本质上属于语义网络。

②  知识图谱的构建主要包括:知识单元的构建(抽取命名实体)、知识单元关系的构建(抽取关系以及属性)和知识的可视化。

③  知识图谱是基于图的数据结构,它的存储方式主要有2种形式:i)RDF存储格式 ii)图数据库


技术难点{非结构化文本的知识提取、数据可视化}

~~~~~NLTK库~~~~~

~~~~~Neo4j图数据库~~~~~

数据可视化:节点类型设计、关系类型设计、节点类型具有属性、Cypher查询语言


 

 

知识图谱构建流程:

网页-->爬虫抓取网页-->数据清洗-->{分词/命名实体识别、实体关系抽取}-->数据存-->前端可视化-->图算法

 



命名实体识别的方法:1)隐马尔可夫模型HMM(Hidden Markov Model)

                    2)最大熵ME(MaxmiumEntropy)

                    3)支持向量机SVM(SupportVector Machine)

                    4)条件随机场CRF(ConditionalRandom Fields)

 

实体关系抽取的方法:1)基于模式匹配的关系抽取

                    2)基于词典驱动的关系抽取

                    3)基于机器学习的关系抽取

                    4)基于Ontology的关系抽取

                    5)混合抽取方法

 

 

陆晓华, 张宇, 钱进. 基于图数据库的电影知识图谱应用研究[J]. 现代计算机,2016(7):76-83.

 

原创粉丝点击