【脚本语言系列】关于Python机器学习scikits-learn,你需要知道的事
来源:互联网 发布:asp聊天室源码 编辑:程序博客网 时间:2024/06/05 23:54
如何使用scikits-learn
- 使用easy_install或pip安装scikits-learn
pip install -U scikit-learneasy_install -U scikit-learn
* 简单计算样例
from sklearn import datasetsboston_prices = datasets.load_boston()print "Data shape", boston_prices.data.shapeprint "Data max = %s min = %s" %(boston_prices.data.max(), boston_prices.data.min())print "Target max = %s min = %s" %(boston_prices.target.max(), boston_prices.target.min())
* 简单聚类分析
1. 下载股票数据
start = datetime.datetime(2011, 01, 01)end = datetime.datetime(2012, 01, 01)quotes = [finance.quotes_historical_yahoo_ochl('^GSPC', start, end, asobject=True, adjusted=True) for symbol in symbols]close = numpy.array([q.close for q in quotes]).astype(numpy.float)print close.shape
2. 计算亲和度矩阵
logreturns = numpy.diff(numpy.log(close))print logreturns.shapelogreturns_norms = numpy.sum(logreturns ** 2, axis = 1)S = -logreturns_norms[:, numpy.newaxis]-logreturns_norms[numpy.newaxis,:]+2*numpy.dot(logreturns, logreturns.T)
3. 亲和传播聚类
aff_pro = sklearn.cluster.AffinityPropagation().fit(S)labels = aff_pro.labels_for i in xrange(len(labels)): print "%s in Cluster %d" % (symbols[i],labels[i])
什么是scikits-learn
scikits-learn项目提供了机器学习相关的API。sckits-learn项目中包含了若干数据集和范例图像,可以用来做一些实验。
聚类(clustering)代表一类机器学习算法,用来基于相似度对研究对象分组。
0 0
- 【脚本语言系列】关于Python机器学习scikits-learn,你需要知道的事
- 【脚本语言系列】关于Python图像处理scikits-image, 需要知道的事
- 【脚本语言系列】关于Python系统管理,你需要知道的事
- 【脚本语言系列】关于Python容器,你需要知道的事
- 【脚本语言系列】关于Python调试报错,你需要知道的事
- 【脚本语言系列】关于Python开发环境搭建,你需要知道的事
- 【脚本语言系列】关于Python数值计算NumPy, 你需要知道的事
- 【脚本语言系列】关于Python测试工具lettuce, 你需要知道的事
- 【脚本语言系列】关于Python测试工具mock, 你需要知道的事
- 【脚本语言系列】关于Python测试工具unittest, 你需要知道的事
- 【脚本语言系列】关于Python测试工具docstrings, 你需要知道的事
- 【脚本语言系列】关于Python测试工具Pyflakes, 你需要知道的事
- 【脚本语言系列】关于Python测试工具Pylint, 你需要知道的事
- 【脚本语言系列】关于Python性能分析工具timeit, 你需要知道的事
- 【脚本语言系列】关于Python代码分析工具line_profiler,你需要知道的事
- 【脚本语言系列】关于Python游戏工具Pygame,你需要知道的事
- 【脚本语言系列】关于Python数值计算Pandas,你需要知道的事
- 【脚本语言系列】关于Python统计分析statsmodel,你需要知道的事
- java实现用户分页消息功能
- 最短路径—Dijkstra算法和Floyd算法
- springmvc requestbody 返回json 乱码问题
- axis开发webservice
- OpenStack与SDN控制器的集成
- 【脚本语言系列】关于Python机器学习scikits-learn,你需要知道的事
- Python的虚拟环境virtualenv
- 解决ECShop transport.js与jQuery冲突
- 关于java线程的经典面试题。主线程子线程交替执行n次
- Brick Wall
- Kafka分区与group
- centos vi命令 常用操作
- hdu2844 多重背包+二进制优化
- springmvc 拦截器配置出错导致重复拦截多次,且不能访问项目