指代消解系列(1)-综述

来源:互联网 发布:office2010有哪些软件 编辑:程序博客网 时间:2024/04/30 04:30

一、什么是指代消解?

1、指代的基本概念

指代作为一种常见的语言现象,广泛存在于自然语言的各种表达中。

eg:***俄罗斯总统***  在德国发表讲话时表示:“我们不排除中油集团参与已拍卖的尤甘斯克的生产。”***他***  表示,中油集团没有参加这次拍卖

中文的指代主要有以下三种典型的形式【1】:
1.人称代词(Pronoun)
【李明】怕高妈妈一人呆在家里寂寞,【他】便将家里的电视搬了过来。
2.指示代词(Demonstrative)
【很多人都想创造一个美好的世界留给孩子】,【这】可以理解,但不完全正确
3.有定描述(Definite Description)
【贸易制裁】似乎成了【美国政府在对华关系中惯用的大棒】。然而,这【大棒】果真如美国政府所希望的那样灵验吗?

一般代词消解和早期的指代消解(Anaphora Resolution)指的是对显性代词消解算法的研究,再后来指代消解包含并开始侧重于共指(Coreference,也称同指)消解的研究,之后指代消解又添加了零代词的内容。我的研究重点可能是问答系统中的指代消解,所以侧重于显性代词和零代词消解,对共指划分只做简单介绍,后文不强调是零代词的内容均指显性代词消解。

显性代词消解 是指当前的照应语与上下文出现的词、短语或句子(句群)存在密切的语义关联性,指代依存于上下文语义中,在不同的语言环境中可能指代不同的实体,具有非对称性和非传递性
零代词消解 是恢复零代词指代前文语言学单位的过程,有时也被称为省略恢复
共指消解 主要是指两个名词(包括代名词、名词短语)指向真实世界中的同一参照体,这种指代脱离上下文仍然成立

1.1 显性代词消解

所谓显性代词消解,就是指在篇章中确定显性代词指向哪个名词短语的问题,代词称为指示语或照应语(Anaphor),其所指向的名词短语一般被称为先行语(Antecedent),根据二者之间的先后位置,可分为回指(Anaphora)与预指(Cataphora),其中:如果先行语出现在指示语之前,则称为回指,反之则称为预指。

1.2 零代词消解

所谓零代词消解,是代词消解中针对零指代(Zero Anaphora)现象的一类特殊的消解。在篇章中,用户能够根据上下文关系推断出的部分经常会省略,而省略的部分(用零代词(Zero Pronoun)表示)在句子中承担着相应的句法成分,并且回指前文中的某个语言学单位。零指代现象在中文中更加常见,(中华语言博大精深。。)近几年随着各大评测任务的兴起开始受到学者们的广泛关注。

1.3 共指消解

所谓共指消解,是将篇章中指向同一现实世界客观实体(Entity)的词语划分到同一个等价集的过程,其中被划分的词语称为表述或指称语(Mention),形成的等价集称为共指链(Coreference Chain)。在共指消解中,指称语包含:普通名词、专有名词和代词,因此可以将显性代词消解看作是共指消解针对代词的子问题。
共指消解与显性代词消解不同,它更关注在指称语集合上进行的等价划分,评测方法与显性代词消解也不近相同,通常使用MUC、B-CUBED、CEAF和BLANC评价方法。

指代消解的研究方法大致可以分为基于启发式规则的、基于统计的和基于深度学习的方法,目前看来,基于有监督统计机器学习的消解算法仍然是主流算法。

Reference

【1】.王厚峰.指代消解的基本方法和实现技术【J】.中文信息学报,2002,16(6):9—17

0 0
原创粉丝点击