统计学习方法概论---(1)

来源:互联网 发布:人工智能发展规划2030 编辑:程序博客网 时间:2024/05/19 16:28

最近在看李航的统计学方法这本书。之前第一次看得时候,看到公式以及叙述感觉很枯燥,随便翻了几页就搁置了。但前天(2017/09/16)又拿起这本书,首先是自己竟然能静下心看得进去,并且能理解,也能联想到吴恩达讲的机器学习内容。之前随手把笔记写在本子上,有一些不足就是易丢失,出门翻阅不方便,所以在八哥(八哥的博客,可以多来转转)的建议下,重新拾起CSDN。慢慢把读书心得以及个人认为很有必要的知识点逐一记录整理。今天就先从统计学方法最基本的概念入手,先有整体认识。其他的知识点,后续整理。

1.统计学习概念:

统计学习是计算机基于数据结构 构建概率统计模型,并运用模型对数据进行预测与分析的一门学科。(李航《统计学方法》)
也即是统计机器学习。

2.统计学习主要特点

  1. 以计算机网络为平台
  2. 以数据为对象
  3. 目的:对数据进行分析和预测
  4. 以方法为中心,构建模型且用模型进行预测和分析。
  5. 概率论,统计学,信息论,计算机理论多领域交叉学科。

3 .研究对象:数据。提取数据特征,抽象数据模型,学习数据中的知识,又运用模型到数据分析和预测。

4.目的:对数据进行分析和预测。尤其是对未知新数据进行分析和预测。
统计学习总的目的:学习何种模型,如何学习模型。在提高分析和预测准确率的前提下,尽可能提高学习效率。

5.有监督学习,非监督学习,半监督学习,强化学习等组成。

统计学习方法 主要讨论监督学习。
在此前提下,可简单概括为:从已经给定,有限的,用于学习的training set 出发,假设数据独立同分布,由一个评价准则从假设空间选取一个最优模型,并用来对training set 和未知数据,在评价准则下,给出最优预测。

6.统计学习方法三要素
1. 模型:假设空间
2. 策略:确定模型选择准则
3. 算法:求解最优模型

7.实现统计学方法步骤:
(1). 给定一有限的训练集training set
(2). 确定假设空间,也就是学习模型的集合
(3). 确定模型选择准则
(4). 实现求解最优模型
(5). 运用最优模型,对未知数据进行预测or分析。

参考文献:
李航《统计学习方法》

原创粉丝点击