利用贝叶斯分类器对fetch_20newsgroups数据集进行分类
来源:互联网 发布:淘淘汽配网上商城源码 编辑:程序博客网 时间:2024/05/20 16:41
from sklearn.datasets import fetch_20newsgroups
from sklearn.cross_validation import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import classification_report
news = fetch_20newsgroups(subset='all')#本次使用的数据需要到互联网上下载
#查看数据
print(len(news.data))
print(news.data[0])
#对数据训练集和测试件进行划分
X_train,X_test,y_train,y_test = train_test_split(news.data,news.target,test_size=0.25,random_state=33)
vec = CountVectorizer()
X_train = vec.fit_transform(X_train)
X_test = vec.transform(X_test)
#利用贝叶斯分类器对数据进行分类
mnb = MultinomialNB()
mnb.fit(X_train,y_train)
y_predict = mnb.predict(X_test)
print('The accuracy of Naive Bays Classifier is',mnb.score(X_test,y_test))
print(classification_report(y_test,y_predict,target_names=news.target_names))
from sklearn.cross_validation import train_test_split
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import classification_report
news = fetch_20newsgroups(subset='all')#本次使用的数据需要到互联网上下载
#查看数据
print(len(news.data))
print(news.data[0])
#对数据训练集和测试件进行划分
X_train,X_test,y_train,y_test = train_test_split(news.data,news.target,test_size=0.25,random_state=33)
vec = CountVectorizer()
X_train = vec.fit_transform(X_train)
X_test = vec.transform(X_test)
#利用贝叶斯分类器对数据进行分类
mnb = MultinomialNB()
mnb.fit(X_train,y_train)
y_predict = mnb.predict(X_test)
print('The accuracy of Naive Bays Classifier is',mnb.score(X_test,y_test))
print(classification_report(y_test,y_predict,target_names=news.target_names))
阅读全文
0 0
- 利用贝叶斯分类器对fetch_20newsgroups数据集进行分类
- 使用CountVectorizer和TfidfVectorizer对fetch_20newsgroups数据进行分类,并对是否使用停用词进行对比(精确度)
- 利用DecisionTree对titanic数据进行分类
- 对数据进行分类
- caffe对自定义数据集进行分类
- 利用BP神经网络对语音数据进行分类
- 利用SVC(Support Vector Classifier)对digits数据进行分类
- 利用贝叶斯算法对垃圾邮件进行分类处理
- 虚拟机Ubuntu14.04+Caffe+libsvm对数据集进行分类
- Nearest Neighbor算法对Cifar-10数据集进行分类
- 使用knn和logsitic对make_blobs数据集进行分类
- c#神经网络,实现对Iris数据集进行分类
- 利用libsvm进行分类
- 利用距离进行分类
- 利用keras进行分类
- 利用随机森林和梯度替身决策树对titanic数据进行分类,并对结果进行分析
- 使用朴素贝叶斯分类器对新闻文本数据进行类别预测
- 对情况进行分类
- 如何使用中文维基百科语料
- 安卓集成webApp,方法互调及集成两个webApp之间的跳转
- axis2 webservice
- 练习题 用到了 listview多条目 GridView+listview 侧滑 ,TabLayout .PullToRefreshListView PullToRefreshScrollV
- BaseAdapter适配器
- 利用贝叶斯分类器对fetch_20newsgroups数据集进行分类
- __attribute__ noreturn 用法
- Fragment+GridView+轮播图
- DarwinStreamingSrvr5.5.5-Windows安装时报错问题解决
- 从AFX_MANAGE_STATE(AfxGetStaticModuleState())说起
- 每日一练20171019
- pyhton 中文汉字转拼音-xpinyin
- 嵌入式linux开发环境搭建相关
- Filter、FilterChain、FilterConfig源码翻译