kaggle MovieSentiment 情感分类的简单套路

来源:互联网 发布:dm1016破解网络限制 编辑:程序博客网 时间:2024/06/05 15:43

问题:简单的对电影评论进行情感分类的问题

方案:采用了最基础的基于tfidf的向量化+lr和word2vec向量+lr以及word2vec+单层lstm三种方案,供大家参考。

评分:tfidf在0.84左右,word2vec在0.86左右,30轮训练的word2vec+lstm的auc在0.86左右还需要调整。

源码如下。

点击打开链接

细做的话,还可以考虑ensemble主题向量,以及模型融合,应该效果会更好一些。

原创粉丝点击