基于stanford nlp(JAVA)实现关系抽取
来源:互联网 发布:vb中四舍五入取整函数 编辑:程序博客网 时间:2024/06/05 07:46
关系抽取是自然语言处理和理解的重要任务之一,就是从自由文本中发现实体对(人物、地点、机构、事件)及实体之间的关系。
关系抽取一般采用三元组,(实体,关系,实体)。因此关系抽取是知识图谱构建的重要环节之一。当前关系抽取已经有了各种方法,如有监督,远程监督、神经网络的关系抽取方法。本篇博客则侧重于工程应用中实体关系抽取的实现,主要基于Stanford NLP的库来实现。(见https://nlp.stanford.edu/software/relationExtractor.html),具体的关系抽取的实现方法见课件:https://web.stanford.edu/class/cs224u/materials/cs224u-2016-relation-extraction.pdf。
目前stanford nlp主要支持 Live_In, Located_In, OrgBased_In, Work_For, and None.这几种关系,它们的准确率介绍如下:
Label Correct Predict Actual Precn Recall F Roth/Yih F1Live_In 239.0 302.0 521.0 79.1 45.9 58.1 51.6Located_In 179.0 212.0 406.0 84.4 44.1 57.9 56.2OrgBased_In 169.0 252.0 452.0 67.1 37.4 48.0 51.7Work_For 185.0 247.0 401.0 74.9 46.1 57.1 52.0_NR 36176.0 37163.0 36396.0 97.3 99.4 98.4Total 772.0 1013.0 1780.0 76.2 43.4 55.3
可见关系抽取这一任务还有待改进之处特别多。
测试如下:
(1) Tim Cook is the CEO of Apple, he replaced Steve Jobs, who died in 2011.
上述例子,没有发现乔布斯与APPLE之间的关系。
(2)Obama was born in Hawaii. He is our president.
(3)Xi Jinping delivers a report to the 19th National Congress of the Communist Party of China (CPC) at the Great Hall of the People in Beijing
这个例子,做十九大报告的例子相对就不是那么准确了。
(4)The aircraft, a Hainan Airlines flight with 22 Chinese passengers onboard, arrived at a Antarctic airport after a more than 20-hour journey starting from Hong Kong.
- 基于stanford nlp(JAVA)实现关系抽取
- 【NLP】play with stanford nlp
- 使用Stanford NLP工具实现中文命名实体识别
- Stanford Core NLP
- Stanford Core NLP 安装
- NLP之Stanford Parser
- 基于深度学习的关系抽取
- stanford nlp第四课“语言模型(Language Modeling)”
- stanford nlp第五课“拼写纠错(Spelling Correction)”
- 利用Stanford Parser进行中文观点抽取(附代码)
- 基于依存关系的空间关系抽取算法
- stanford-NLP-CLASS1课堂笔记
- Stanford NLP工具--句法分析
- 关系抽取
- 用Java实现从Xml抽取数据到关系型数据库
- 用stanford nlp的classfier组件的Java API做文本分类
- 基于神经网络的实体识别和关系抽取联合学习
- 基于神经网络的实体识别和关系抽取联合学习
- luoguP2596 [ZJOI2006]书架(splay)
- 蓝桥杯 ADV_193 算法提高 新建Microsoft Word文档 (java)
- 数据结构实验之排序二:交换排序
- 服务器主动向客户端发送信息机制
- HDOJ 2032 杨辉三角
- 基于stanford nlp(JAVA)实现关系抽取
- 【中文字幕】2017春季CS231n 斯坦福深度视觉识别课,李飞飞
- reason: connect ETIMEDOUT
- 根据log绘制loss、accuracy的变化图
- 1、Excel:函数小结
- flvAnalyser 分析工具版本发布详情
- JAVA集合
- 使用UDP协议编写一个网络程序,设置接收端程序的监听端口是8001,发送端发送的数据是“Hello, world”
- 【深度学习】VGG-16网络结构