[ACL2017]Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme
来源:互联网 发布:nrf24l01与单片机连接 编辑:程序博客网 时间:2024/05/19 18:37
entities识别和relations的判别目前有两种做法:1. pipeline的做法,首先识别实体,其次判断实体之间的关系类型(包含other);2. joint的方法,抽取实体和判断关系同时进行,比较典型的两篇文章是2013年ACL《Joint Event Extraction via Structured Prediction with Global Features》和2015年ACL《End-to-End Relation Extraction using LSTMs on Sequence and Tree Structures》(严格来讲,2015年的这篇文章并不能算是joint方法),不同于以往的两种做法,本文给出了一个新颖的思路,将entities的识别和relation的判断两个小任务合成一个任务来考虑,创新点如下:
(1)将联合抽取entities和判断relations的两个小任务作为一种标注任务来做
(2)基于这种标注模式,实验结果优于以往的pipeline和joint方法
(3)用了一个biased loss function以适应这种标注模式,强化了相关entities之间的关联
针对联合抽取entities和relations的标注模式,本文给出了一套新的标签,鉴于有人以详细的解释了该套标签,本文不再过多赘述,仅引用:
引用地址:http://www.sohu.com/a/147437571_500659
另外在文章的3.2小节中提到,如果一句话中包含两个或多个三元组是相同关系类型的话那么组成triplet采用就近原则。那么有几个疑问:
(1)如果一个实体参与了多个关系类型不同triplet,这套标签就不能表达这个关系,举个例子,美国总统川普,同时也是川普公司掌门人,这句话中有两个关系,也就是说川普这个实体是两个triplet的实体,而且这两个triplet关系类型不同,无法给川普打标签,或者说只能识别一个关系
(2)国家主席,军委主席习近平发表重要讲话,对这种交叉标签情况不使用
第二部分,本文采用的网络架构:
因为标签之间是有依存关系的(E-CP-1只能出现在B-CP-1和I-CP-1之后,不能出现在其他标签的后面)所以在解码的用CRF的特长可以发挥出来,但是本文没有采用目前很流行的做法biLSTM+CRF, 而是采用了LSTM+Softmax的做法,不能确定这另种做法哪种更好,待验证。
第三部分:目标函数(创新点之一)
采用了2012年Hinton提出的RMSprop , 我理解的不透彻,待理解明白了再更新
- [ACL2017]Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme
- [ACL2017]Going out on a limb:Joint Extraction of Entity Mentions and Relations without Depende...
- 论文阅读笔记-CoType: Joint Extraction of Typed Entities and Relations with Knowledge Bases
- Extraction of Entities and Relations调研
- Entities and Entities's Relation Extraction of ACE 2005
- HSOG: A Novel Local Image Descriptor Based on Histogram of the Second-Order Gradients
- A Novel Multi-label Classification Based on PCA and ML-KNN
- A Novel Approach to Improvingthe Efficiency of Storing and Accessing Small Files on Hadoop: a Case S
- 【NDN安全】A novel Interest Flooding Attacks Detection and Countermeasure Scheme in NDN 学习笔记
- 【NDN安全】A novel Interest Flooding Attacks Detection and Countermeasure Scheme in NDN 全文翻译
- 论文读书笔记-THE PECULIARITIES OF THE TEXTDOCUMENTREPRESENTATION, USINGONTOLOGY AND TAGGING-BASED CLUSTERI
- A Survey On Relation Extraction
- Understanding of vSwitch and VLAN tagging
- 2013_CVPR_BoF meets HOG Feature Extraction based on Histograms of Oriented p.d.f Gradients for Image
- 2013_CVPR_BoF meets HOG Feature Extraction based on Histograms of Oriented p.d.f Gradients for Imag
- Novel No Reference Image Blur Metric Based on Block-based Discrete Transform Statistics
- 笔记-2009-An Error-Driven Word-Character Hybrid Model for Joint CWS and POS Tagging
- Start doing a new project based on DM365 of TI
- Apache 虚拟功能- 同一台电脑运行两个以上的网站
- 高效学习之全脑模型
- quartz基本使用
- 解决axios IE11 Promise对象未定义
- Springboot学习-使用AOP统一处理Web请求日志(六)
- [ACL2017]Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme
- 总结运行SSIS包的几种方式
- Python pyinotify模块实现对文档的实时监控功能
- 【搜索入门专题1】hdu1253 【BFS】 F
- Directx11渲染框架重构
- git常用操作
- Find a way HDU
- 光照效果
- 设计模式之禅笔记-模板方法模式