情感分析——《Hierarchical emotion classification and emotion component ...》 2015-12-02

来源:互联网 发布:sql和db2 编辑:程序博客网 时间:2024/04/29 07:46

Expert Systems With Applications 42 (2015) 87458752

《Hierarchical emotion classification and emotion component analysis on chinese micro-blog posts》   

(下周学术报告,该小敏同学讲这篇文章,先看看。后续可能在补充。--------------机器学习课,要求写一篇和自己方向有关的综述,所以现在要多看论文,多总结才好。)


《基于中文微博帖子的情感层次分类和情感成分分析》

摘要:现有的分类都很粗糙,如果数据集过大,则分类器在分类的时候就会很困难。本文应用数据预处理、特征提取、特征选取,把中文微博帖子进行很细粒度的分类。利用情感层次分类来提高分类器的性能。另外,基于回归值分类过程,我们提出了一个算法来挖掘主要的情感,并计算他们的比率。

 

主要内容:

1.情感分类

  1)四层的层次结构  

  2)预处理过程:①人名,@+人名;②话题,#话题#ƒ链接;④位置信息,i am here

  3)特征提取:① 表情符号大笑;②POS词性分析

  4)特征选取:χ 2 -testPMI点互信息 

  5)分类:在支持向量机中采用 SVR package,两个参数 模型参数v和分类阈值。

2.情感成分分析:ECA算法

 

实验部分:

 

改进:

1.更新词典,使词典包含更多的情感词和微博中的俚语。

2.在算法中增加更多的特征来使结果达到更高的准确率。

3.3.作为微博中的一些具有讽刺意味的表达的帖子,需要更深的语义分析,情景分析和上下文分析。

 

注:

1.Meanwhile, SVM can apply to other fields, such as it can be trained with some features so as to identify a test image (Xia, Wang, Sun, & Wang, 2014) and so on.Page 2

2., Naive Bayesian, SVM, and SMO

0 0
原创粉丝点击