[ACL2017]Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme

来源:互联网 发布:nrf24l01与单片机连接 编辑:程序博客网 时间:2024/05/19 18:37

entities识别和relations的判别目前有两种做法:1. pipeline的做法,首先识别实体,其次判断实体之间的关系类型(包含other);2. joint的方法,抽取实体和判断关系同时进行,比较典型的两篇文章是2013年ACL《Joint Event Extraction via Structured Prediction with Global Features》和2015年ACL《End-to-End Relation Extraction using LSTMs on Sequence and Tree Structures》(严格来讲,2015年的这篇文章并不能算是joint方法),不同于以往的两种做法,本文给出了一个新颖的思路,将entities的识别和relation的判断两个小任务合成一个任务来考虑,创新点如下:
(1)将联合抽取entities和判断relations的两个小任务作为一种标注任务来做
(2)基于这种标注模式,实验结果优于以往的pipeline和joint方法
(3)用了一个biased loss function以适应这种标注模式,强化了相关entities之间的关联

针对联合抽取entities和relations的标注模式,本文给出了一套新的标签,鉴于有人以详细的解释了该套标签,本文不再过多赘述,仅引用:
这里写图片描述
引用地址:http://www.sohu.com/a/147437571_500659
另外在文章的3.2小节中提到,如果一句话中包含两个或多个三元组是相同关系类型的话那么组成triplet采用就近原则。那么有几个疑问:
(1)如果一个实体参与了多个关系类型不同triplet,这套标签就不能表达这个关系,举个例子,美国总统川普,同时也是川普公司掌门人,这句话中有两个关系,也就是说川普这个实体是两个triplet的实体,而且这两个triplet关系类型不同,无法给川普打标签,或者说只能识别一个关系
(2)国家主席,军委主席习近平发表重要讲话,对这种交叉标签情况不使用

第二部分,本文采用的网络架构:
这里写图片描述
因为标签之间是有依存关系的(E-CP-1只能出现在B-CP-1和I-CP-1之后,不能出现在其他标签的后面)所以在解码的用CRF的特长可以发挥出来,但是本文没有采用目前很流行的做法biLSTM+CRF, 而是采用了LSTM+Softmax的做法,不能确定这另种做法哪种更好,待验证。
第三部分:目标函数(创新点之一)
采用了2012年Hinton提出的RMSprop , 我理解的不透彻,待理解明白了再更新

阅读全文
0 0
原创粉丝点击