指代消解系列(1)-综述
来源:互联网 发布:office2010有哪些软件 编辑:程序博客网 时间:2024/04/30 04:30
一、什么是指代消解?
1、指代的基本概念
指代作为一种常见的语言现象,广泛存在于自然语言的各种表达中。
eg:***俄罗斯总统*** 在德国发表讲话时表示:“我们不排除中油集团参与已拍卖的尤甘斯克的生产。”***他*** 表示,中油集团没有参加这次拍卖
中文的指代主要有以下三种典型的形式【1】:
1.人称代词(Pronoun)
【李明】怕高妈妈一人呆在家里寂寞,【他】便将家里的电视搬了过来。
2.指示代词(Demonstrative)
【很多人都想创造一个美好的世界留给孩子】,【这】可以理解,但不完全正确
3.有定描述(Definite Description)
【贸易制裁】似乎成了【美国政府在对华关系中惯用的大棒】。然而,这【大棒】果真如美国政府所希望的那样灵验吗?
一般代词消解和早期的指代消解(Anaphora Resolution)指的是对显性代词消解算法的研究,再后来指代消解包含并开始侧重于共指(Coreference,也称同指)消解的研究,之后指代消解又添加了零代词的内容。我的研究重点可能是问答系统中的指代消解,所以侧重于显性代词和零代词消解,对共指划分只做简单介绍,后文不强调是零代词的内容均指显性代词消解。
显性代词消解 是指当前的照应语与上下文出现的词、短语或句子(句群)存在密切的语义关联性,指代依存于上下文语义中,在不同的语言环境中可能指代不同的实体,具有非对称性和非传递性
零代词消解 是恢复零代词指代前文语言学单位的过程,有时也被称为省略恢复
共指消解 主要是指两个名词(包括代名词、名词短语)指向真实世界中的同一参照体,这种指代脱离上下文仍然成立
1.1 显性代词消解
所谓显性代词消解,就是指在篇章中确定显性代词指向哪个名词短语的问题,代词称为指示语或照应语(Anaphor),其所指向的名词短语一般被称为先行语(Antecedent),根据二者之间的先后位置,可分为回指(Anaphora)与预指(Cataphora),其中:如果先行语出现在指示语之前,则称为回指,反之则称为预指。
1.2 零代词消解
所谓零代词消解,是代词消解中针对零指代(Zero Anaphora)现象的一类特殊的消解。在篇章中,用户能够根据上下文关系推断出的部分经常会省略,而省略的部分(用零代词(Zero Pronoun)表示)在句子中承担着相应的句法成分,并且回指前文中的某个语言学单位。零指代现象在中文中更加常见,(中华语言博大精深。。)近几年随着各大评测任务的兴起开始受到学者们的广泛关注。
1.3 共指消解
所谓共指消解,是将篇章中指向同一现实世界客观实体(Entity)的词语划分到同一个等价集的过程,其中被划分的词语称为表述或指称语(Mention),形成的等价集称为共指链(Coreference Chain)。在共指消解中,指称语包含:普通名词、专有名词和代词,因此可以将显性代词消解看作是共指消解针对代词的子问题。
共指消解与显性代词消解不同,它更关注在指称语集合上进行的等价划分,评测方法与显性代词消解也不近相同,通常使用MUC、B-CUBED、CEAF和BLANC评价方法。
指代消解的研究方法大致可以分为基于启发式规则的、基于统计的和基于深度学习的方法,目前看来,基于有监督统计机器学习的消解算法仍然是主流算法。
Reference
【1】.王厚峰.指代消解的基本方法和实现技术【J】.中文信息学报,2002,16(6):9—17
- 指代消解系列(1)-综述
- 指代消解
- 基于VSM的命名实体识别、歧义消解和指代消解
- mp4文件格式系列1 - 综述
- mp4文件格式系列1 - 综述
- 共指消解(coreference resolution)介绍
- Amazon Alexa系列介绍(1)--综述
- 服务器技术系列综述(一)
- 服务器技术系列综述(二)
- 服务器技术系列综述(三)
- 服务器技术系列综述(一)
- 服务器技术系列综述(二)
- 服务器技术系列综述(三)
- OAuth 2.0系列教程(二) 综述
- OAuth 2.0系列教程(二) 综述
- 计算机视觉入门系列(一) 综述
- CoordinatorLayout 使用综述系列(一)
- 《VC++专题研究》系列之-1- 本系列课程综述
- Quartz(任务调度框架) --介绍及应用(一)
- 玩转linux主机--hadoop伪分布式配置及单词计数程序的运行
- 运行时 动态获取成员变量
- 混合高斯模型算法
- 【C++】子对象基础概念及其用法
- 指代消解系列(1)-综述
- Python中pip的安装
- java web开发 邮件接收与发送的原理
- J2EE体系结构
- Linux下which、whereis、locate、find 区别
- 使用org.w3c.dom.Element的setTextContent()、getTextContent()方法时出现编译错误
- Vista/Win7 UAC兼容程序开发指南
- No such file or directory没有这个文件
- 【C++】堆对象