随机森林—算法笔记
来源:互联网 发布:高斯算法 编辑:程序博客网 时间:2024/05/22 01:29
随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树
使用sklearn 随机森林RandomForestClassifier进行Digit Recognizer实验:
from sklearn.ensemble import RandomForestClassifierfrom numpy import genfromtxt, savetxtCPU = -1def main(): print("Reading training set") dataset = genfromtxt('../data/train.csv', delimiter=',', dtype='int64')[1:] target = [x[0] for x in dataset] train = [x[1:] for x in dataset] print("Reading test set") test = genfromtxt('../data/test.csv', delimiter=',', dtype='int64')[1:] # create and train the random forest # n_estimators:决策树的个数,越多越好,但是性能就会越差,至少100左右(具体数字忘记从哪里来的了)可以达到可接受的性能和误差率 # n_jobs:并行job个数。这个在ensemble算法中非常重要,尤其是bagging(而非boosting,因为boosting的每次迭代之间有影响,所以很难进行并行化), # 因为可以并行从而提高性能。1=不并行;n:n个并行;-1:CPU有多少core,就启动多少job rf = RandomForestClassifier(n_estimators=1000, n_jobs=CPU) print("Fitting RF classifier") rf.fit(train, target) print("Predicting test set") savetxt('../data/RandomForestsubmission.csv', rf.predict(test), delimiter=',', fmt='%d')if __name__ == "__main__": main()
参考文献:
http://www.cnblogs.com/maybe2030/p/4585705.html#top
阅读全文
0 0
- 随机森林—算法笔记
- 机器学习—随机森林算法
- 随机森林算法实现
- 随机森林算法
- 随机森林算法实现
- 随机森林算法
- 随机森林算法
- 随机森林算法
- 随机森林算法
- 随机森林算法
- 随机森林算法
- 随机森林算法
- 随机森林算法
- 随机森林算法小结
- 随机森林算法
- 随机森林算法介绍
- 随机森林算法
- 随机森林算法
- spring mvc 笔记
- 事件的注册
- AsyncTask详解 ( 方法、参数 、执行流程详解)
- android获取已安装应用的信息md
- Unity3D 在Game窗口下查看Overdraw视图
- 随机森林—算法笔记
- 【二分 小知识】
- 智能手机行业的“败者”——Windows Phone
- Caffe学习:使用pycaffe绘制loss、accuracy曲线
- RXD and dividing
- java中的auto-boxing/unboxing
- 解决svn冲突的手册
- UI12-导航栏视图控制器的使用
- Caffe学习:使用pycaffe生成mean_file.py文件