NLTK完成简单的情感分析
来源:互联网 发布:好玩的rpg游戏 知乎 编辑:程序博客网 时间:2024/06/06 06:57
# -*- coding: utf-8 -*-
"""
Created on Fri Oct 20 19:16:41 2017
@author: ESRI
"""
from nltk.classify import NaiveBayesClassifier
# 随手造点训练集
s1 = 'this is a good book'
s2 = 'this is a awesome book'
s3 = 'this is a bad book'
s4 = 'this is a terrible book'
def preprocess(s):
return {word: True for word in s.lower().split()}
# Func: 句句子处理理
# 这里里简单的用了了split(), 把句句子中每个单词分开
# 显然 还有更更多的processing method可以用
# return长这样:
# {'this': True, 'is':True, 'a':True, 'good':True, 'book':True}
# 其中, 前一个叫fname, 对应每个出现的文本单词;
# 后一个叫fval, 指的是每个文本单词对应的值。
# 这里里我们用最简单的True,来表示,这个词『出现在当前的句句子中的意义。
# 当然啦, 我们以后可以升级这个方程, 让它带有更更加牛逼的fval, 比如 word2vec
# 把训练集给做成标准形式
training_data = [ [preprocess(s1), 'pos'],
[preprocess(s2), 'pos'],
[preprocess(s3), 'neg'],
[preprocess(s4), 'neg']]
# 喂给model吃
print(training_data)
model = NaiveBayesClassifier.train(training_data)
# 打出结果
"""
Created on Fri Oct 20 19:16:41 2017
@author: ESRI
"""
from nltk.classify import NaiveBayesClassifier
# 随手造点训练集
s1 = 'this is a good book'
s2 = 'this is a awesome book'
s3 = 'this is a bad book'
s4 = 'this is a terrible book'
def preprocess(s):
return {word: True for word in s.lower().split()}
# Func: 句句子处理理
# 这里里简单的用了了split(), 把句句子中每个单词分开
# 显然 还有更更多的processing method可以用
# return长这样:
# {'this': True, 'is':True, 'a':True, 'good':True, 'book':True}
# 其中, 前一个叫fname, 对应每个出现的文本单词;
# 后一个叫fval, 指的是每个文本单词对应的值。
# 这里里我们用最简单的True,来表示,这个词『出现在当前的句句子中的意义。
# 当然啦, 我们以后可以升级这个方程, 让它带有更更加牛逼的fval, 比如 word2vec
# 把训练集给做成标准形式
training_data = [ [preprocess(s1), 'pos'],
[preprocess(s2), 'pos'],
[preprocess(s3), 'neg'],
[preprocess(s4), 'neg']]
# 喂给model吃
print(training_data)
model = NaiveBayesClassifier.train(training_data)
# 打出结果
print(model.classify(preprocess('this is a goodbook')))
结果:
pos
阅读全文
0 0
- NLTK完成简单的情感分析
- word2Vec--(1) nltk实现简单的切词,情感分析,文本相似度(TF-IDF)
- 【自然语言处理】利用nltk实现情感分析
- nltk的简单应用
- NLTK在python中文字所表达的情感预测
- 用python实现简单的文本情感分析
- cs224d 作业 problem set1 (二) 简单的情感分析
- 情感分析的新方法
- [情感分析的新方法]
- NLTK学习之一:简单文本分析
- NLTK入门1:简单句子结构分析
- 情感分析的词典资源
- 情感分析的学习资源
- 基于情感分析的mapreduce
- 基于情感字典的文本情感极性分析
- 干货:完全基于情感词典的文本情感分析
- 情感分析
- 情感分析
- 开始时间和结束时间的时间间隔不能大于24小时
- Postgresql 连接方式_连接五要素_psql
- ES6——剩余参数
- Github使用教程(二)------ Github客户端使用方法
- 小光棍数
- NLTK完成简单的情感分析
- XAMPP Apache 设置virtual host
- ArcGIS Server发布地图服务
- 在一个千万级的数据库查寻中,如何提高查询效率?
- ch8.1 Android HAL层简介
- unity HTC眨眼效果
- zeppelin + spark 遇到的坑
- Python培训(4)
- 【java8新特性】