【nlp】文本情感分析

来源:互联网 发布:samba windows 编辑:程序博客网 时间:2024/04/26 04:24

基于词典的情感分析
情感分析对象的粒度最小是词汇,但是表达一个情感的最基本的单位则是句子,词汇虽然能描述情感的基本信息,但是单一的词汇缺少对象,缺少关联程度,并且不同的词汇组合在一起所得到的情感程度不同甚至情感倾向都相反。所以以句子为最基本的情感分析粒度是较为合理的。篇章或者段落的情感可以通过句子的情感来计算。
基于词典的情感分析大致步骤如下:
分解文章段落
分解段落中的句子
分解句子中的词汇
搜索情感词并标注和计数
搜索情感词前的程度词,根据程度大小,赋予不同权值
搜索情感词前的否定词,赋予反转权值(-1)
计算句子的情感得分
计算段落的情感得分
计算文章的情感得分
考虑到语句中的褒贬并非稳定分布,以上步骤对于积极和消极的情感词分开执行,最终的到两个分值,分别表示文本的正向情感值和负向情感值。

作者:黄老邪怪
链接:http://www.jianshu.com/p/60505518d7ee
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

原创粉丝点击