数据科学
来源:互联网 发布:c语言99乘法表for 编辑:程序博客网 时间:2024/04/28 00:01
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!
数据科学最近成为计算机的热门领域。数据科学是利用计算机的运算能力对数据进行处理,从数据中提取信息,进而形成“知识”。它已经影响了计算机视觉、信号处理、自然语言识别等计算机分支。数据科学已经在IT、金融、医学、自动驾驶等领域得到广泛使用。(如果你熟知中情局的棱镜泄密事件,你会发现数据科学已经在情报领域广泛使用。)
在这系列文章中,我希望能完成从概率论,统计,到机器学习的整个数据分析的链条。传统意义上的数据处理是用统计方法实现的,而概率论是统计的基础。随着计算机处理能力的增强,一些需要大量运算的数据分析方法得到快速发展。机器学习实际上是一个混合体,包括一些在计算机领域中发展的算法,也包括一些传统统计中已经存在,但受限于计算能力的统计方法。另一方面,从数据中提炼知识是机器学习的主要目的,这与统计推断密切相关。因此,从传统的概率和统计出发,更容易理解机器学习的内涵。
当然,这样做的困难之处是要覆盖许多内容。严格的叙述有时会显得比较无聊。我会尽力引入实用的编程例子,以便能形成更好的触觉。编程工具会以Python语言为主,配以第三方的包,比如Numpy, Scipy, Matplotlib, scikit-learn。统计和机器学习同样可以在其他语言中实现,比如Matlab和R语言。如果你熟悉相应的工具,不难写出类似功能的代码。
概率论
计数
概率公理
条件概率
随机变量
离散分布
连续分布
联合分布
随机变量的函数
期望与方差
极限理论
统计基础
数据描述
参数估计
区间估计
假设检验
线性回归
ANOVA
无参估计
贝叶斯方法
多变量统计
机器学习
<script type="text/javascript"><!--google_ad_client = "ca-pub-1944176156128447";/* cnblogs 首页横幅 */google_ad_slot = "5419468456";google_ad_width = 728;google_ad_height = 90;//--></script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
- 数据科学
- 数据科学
- 让科学重回数据科学
- 普通人的数据科学
- 数据科学维恩图
- 命令行中的数据科学
- 《命令行中的数据科学》
- 数据科学领域WIKI
- 数据科学极简史
- 数据科学系列读书笔记
- Python 数据科学入门
- 数据科学bloger
- 数据科学电子书书单
- 数据科学入门:前言
- 数据科学的未来
- 数据科学传送门
- 数据科学实战(一)
- 数据科学实战(二)
- jQuery自定义函数
- live555源码分析-live555大致流程
- jquery 插件开发
- Deformable Part Model的学习
- jquery遍历筛选数组的几种方法和遍历解析json对象
- 数据科学
- live555 类之间的依属关系和功能分析
- 杭电4515-小Q系列故事——世界上最遥远的距离
- HDU 1312 DFS
- GDI+不同的地方
- linux下java环境配置
- 使用POI 导入excel
- ios常见的几种传值方式
- 从程序员到项目经理(24):慎于问敏于行