试用Orange进行数据挖掘:Classification
来源:互联网 发布:linux 内存使用 编辑:程序博客网 时间:2024/06/06 03:58
环境
--------------------------------------------------------
Kubuntu 12.04/Python 2.7.3/Orange 2.0b
准备工作
--------------------------------------------------------
#1.下载Orange的源码和Numpy的源码#2.编译Numpy#3.安装Python开发包sudo apt-get install python-dev#4.安装Python networkx包sudo apt-get install python-networkx#5.编译Orangepython install.py build
测试
--------------------------------------------------------import orange#导入orangeorange.version'2.0b (21:58:41, Nov 3 2012)'
Classification
--------------------------------------------------------从UCI Machine Learning Repository]下载一个测试数据集;比如Voting.tab
Naive Bayes classifier
--------------------------------------------------------
import orangedata = orange.ExampleTable("voting")classifier = orange.BayesLearner(data)for i in range(5): c = classifier(data[i]) print("original",data[i].getclass(),"classified as",c)输出结果
original republican classified as republicanoriginal republican classified as republicanoriginal democrat classified as republicanoriginal democrat classified as democratoriginal democrat classified as democrat可以看出,Naive Bayes在第三个实例处出现了错误,但是其他的都是正确的。
import orangedata = orange.ExampleTable("voting")classifier = orange.BayesLearner(data)corrcetNum = 0#计数器for i in data: a = i.getclass() b = classifier(i) if a == b: corrcetNum += 1print "CA:%.3f" %(float(corrcetNum)/len(data))#计算分类正确率输出结果
Possible classes: <republican,democrat>CA:0.9034可见Naive Bayes在总数量比较大的情况下,Classification的正确率还是比较好的,但是也只能说是一般。
参考资料
--------------------------------------------------------
* Orange reference : http://orange.biolab.si/doc/reference/* Orange tutorial : http://orange.biolab.si/doc/tutorial/
- 试用Orange进行数据挖掘:Classification
- python数据挖掘orange
- 使用Orange进行数据挖掘之聚类分析(2)------K-means
- 使用Orange进行数据挖掘之分类(2)------KNN分类
- 使用Orange进行数据挖掘之分类(3)------决策树
- 使用Orange进行数据挖掘之分类(4)------SVM
- 使用Orange进行数据挖掘之关联------Apriori
- 利用orange进行关联规则挖掘
- 使用Orange进行数据挖掘之聚类分析(1)------层次聚类
- 使用Orange进行数据挖掘之分类(1)------朴素贝叶斯分类
- 开源数据挖掘工具 Orange
- 开源数据挖掘工具Orange简介
- 数据挖掘工具介绍-----推荐Orange
- 数据挖掘-目录-分类器(classification)
- Orange的数据挖掘工具入门使用by tsy
- sklearn进行数据挖掘
- 使用Weka进行数据挖掘
- 数据挖掘进行客户关系管理
- Oracle语句优化
- SIP 资源
- 七种RAID总结笔记
- 5种流行的Linux发行版
- Linux RTC 驱动模型分析(2)
- 试用Orange进行数据挖掘:Classification
- android中httpclient和HttpURLConnection优缺点和常见bug解决方法
- SSH常用命令
- 通过STL vector容器实现对map容器按值排序,不用sort函数
- Java内存模型
- 仿网易新闻效果源码分析
- 【JSP】赵雅智_jsp简介
- IE8 与 VS2005 冲突问题解决方法
- 11-6数据库加强(子查询(独立子查询,相关子查询),分页显示,开窗函数 over(),join )