aspect-based情感分析的调研

来源:互联网 发布:淘宝订单没有代付选项 编辑:程序博客网 时间:2024/05/19 19:41

基于aspect的情感分析指的是挖掘句子中涉及的aspect,以及对每个aspect表现出来的情感。现有的工作一般把这个任务分成两个部分:aspect识别,可以是aspect term提取或者aspect分类;aspect的情感识别。aspect term提取指的是从原文本中直接提取涉及到的aspect的单词或词组,而aspect分类指的是为每个领域预定义aspect种类,然后对每个句子进行分类(可以属于一个或多个aspect,也可以不属于任何aspect)。有很多相关的文献把ABSA看作两个分离的子任务,即在判断sentiment并不考虑针对的aspect的信息,这样导致分类不正确,因为同一个形容词对不同aspect或在不同领域形容不同的aspect时表达的情感是不一样的,比如,在restaurant领域,cheap在形容food时是positive的,但形容ambience时表达的是negative。所以在ABSA任务中,需要考虑aspect和sentiment 信息之间的交互。

下面分别针对每个子问题,列举现有的相关研究,从无监督、传统机器学习和深度学习三类方法进行介绍。

aspect识别:

(1)aspect term提取

无监督方法:


Hu 2004:首先从这篇ABSA开山之作开始介绍。本文同时解决了aspect term提取(原文称为feature term提取)以及情感判断问题。这里并不介绍情感判断的方法,而是留在情感识别里介绍。对接下来将要讨论的所有文献都一样。首先需要对所有的单词标注词性,并且认为feature是名词或者名词短语。首先通过关联聚类的方法,提取预料中经常出现的名词或者名词短语。

Popescu 2005:

问题:根据频率提取aspect term有如下缺点:首先,并不是所有的aspect以名词或者名词短语的形式出现,比如It is tasty,其中的aspect是通过tasty表示的,而tasty是形容词;其次,对于一个名词表示的aspect,通过频率容易得到,但是如果aspect是由多个低频的名词组合在一起的时候,频率方法并不那么有效,比如food包含各种鱼类;另外,有的aspect在文本中并不直接提及,是以抽象方式表述的,比如谈论ambience时可以不涉及任何名词。

传统机器学习方法:



深度学习方法:

(2)aspect分类



sentiment识别:

0 0
原创粉丝点击