朴素贝叶斯分类
来源:互联网 发布:软件项目招标网 编辑:程序博客网 时间:2024/06/05 20:49
数据地址:https://www.kaggle.com/c/sentiment-analysis-on-movie-reviews
#-*- coding:utf-8 -*-#朴素贝叶斯import pandas as pdimport numpy as npfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.datasets.base import Bunchfrom sklearn.naive_bayes import MultinomialNB #导入多项式贝叶斯算法包import zipfileimport sysreload(sys)sys.setdefaultencoding('utf-8')z=zipfile.ZipFile('train.tsv.zip')df=pd.read_csv(z.open(z.namelist()[0]),header=0,delimiter='\t')x=df['Phrase'].as_matrix()y=df['Sentiment'].as_matrix()train_x=x[:100000]train_y=y[:100000]test_x=x[-50000:]test_y=y[-50000:]trainSpace=Bunch(tdm=[],label=[],vocabulary={}) #tdm tfidf词向量矩阵 label 类别 vocabulary词汇表testSpace=Bunch(tdm=[],label=[],vocabulary={})vect_train=TfidfVectorizer(stop_words='english',sublinear_tf=True,max_df=0.25)trainSpace.tdm=vect_train.fit_transform(train_x)trainSpace.label=train_ytrainSpace.vocabulary=vect_train.vocabulary_vect_test=TfidfVectorizer(stop_words='english',sublinear_tf=True,max_df=0.25,vocabulary=trainSpace.vocabulary)testSpace.tdm=vect_test.fit_transform(test_x)testSpace.label=test_ytestSpace.vocabulary=trainSpace.vocabularyclf=MultinomialNB(alpha=0.00001).fit(trainSpace.tdm,trainSpace.label)predicted=clf.predict(testSpace.tdm)total=len(test_x)rate=0for label,text,pre in zip(testSpace.label,test_x,predicted): if label!=pre: rate+=1 print text," 实际类别:",label," 预测类别:",preprint "错误率:",float(rate)*100/float(total),"%"print clf.score(testSpace.tdm,test_y)
阅读全文
0 0
- 朴素贝叶斯分类
- 朴素贝叶斯分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯--情感分类
- 朴素贝叶斯分类器
- 朴素贝叶斯—分类
- 朴素贝叶斯分类器
- 朴素贝叶斯分类
- 朴素贝叶斯分类
- 分类-朴素的贝叶斯
- 朴素贝叶斯分类器
- 朴素贝叶斯分类器
- 朴素贝叶斯分类器
- 安装SparkR
- 汇编语言入门二:环境有了先过把瘾
- 【C语言】【unix c】将头文件放在默认的头文件搜索目录里面
- 筛选法求素数
- 如何用VMWare Sphere API创建/恢复/列出/删除Snapshot
- 朴素贝叶斯分类
- 《失控》之三--有心智的机器
- [多校补题]2017 Multi-University Training Contest 4 solutions BY 陈松杨
- 1042: [HAOI2008]硬币购物
- [笔记分享] [SD] 块设备驱动学习小结
- js MD5加密
- javascript中一些数组函数的简单归纳
- java网络编程(TCP\UDP)
- C 实现英语句子翻转 单词字母顺序不变(i love you -----> you love i)