Stanford Online-统计学习-ISLR-Ch2-Statistical Learning
来源:互联网 发布:c 源码 user32.dll 编辑:程序博客网 时间:2024/04/20 21:19
1. Regression Function
假设要拟合的数据是一维的,即
看图中
刚刚说“最合理是给它一个
而使得这个数学期望最小的解就是上面的
上面讲了
这里需要特别注意的是,
即使是对世界上所有的数据进行建模,建立出来的模型也不可能是完全准确的,肯定是会存在误差
OK! 终于弄清楚了这两个
又重复到上一段讲的,因为
2. Nearest Neighbor
因为按照上面所讲的方法去建模,我们取的
当一个新的数据
然后再有平均值来表示数学期望,就有:
2.1 维灾难
Nearest Neighbor其实只对低维且数据量大的
明显看到,同样是取10%的数据,一维空间上(
比如有一个p维的超方体,其边长为1,只要存在一个
则该超方体中属于非边界的体积为
3. Structured Models
这个近似模型方法地提出就是为了解决“维灾难”。因为维灾难是因为邻域带来的,只要我们的近似方法中不再出现邻域,维灾难就不会出现。于是Structured Models不再通过邻域取平均的方法来近似数学期望了,而是直接假设
比如说,设
然后从观测数据集中,通过最小化误差二乘方,计算出
当然可以假设
4. Bias-Variance Trade-off
令
其中,
这里需要说明一下,因为这是在模型选择过程中,所以
观察一下
5. 分类问题
来看懂下面这个图,这个图有点儿难看懂,记录一下:
黄色的bar代表类别是0,蓝色的bar代表类别是1,x代表特征值,y代表该特征值下类别为1的概率,黑色的曲线是真实模型
令
5.1 Bayes Optimal Classification
贝叶斯最优分类就是真实模型的分类:
式子中的
贝叶斯最优分类模型在测试集上得到的误差被称为贝叶斯误差,即最小可能误差。下面这张图中,中间平行的黑色虚线就是贝叶斯误差:
- Stanford Online-统计学习-ISLR-Ch2-Statistical Learning
- Stanford Online-统计学习-ISLR-Ch3-Linear Regression
- Statistical learning Week 1 什么是统计学习?
- 统计学习精要 (Elements of Statistical Learning ) 习题 2.1
- 统计学习精要 (Elements of Statistical Learning ) 习题 2.2
- 统计学习精要 (Elements of Statistical Learning ) 习题 2.3
- 统计学习精要 (Elements of Statistical Learning ) 习题 2.4
- 统计学习精要 (Elements of Statistical Learning ) 习题 3.20
- 统计学习精要 (Elements of Statistical Learning ) 习题 3.21
- 统计学习精要 (Elements of Statistical Learning ) 习题 4.1
- 统计学习精要 (Elements of Statistical Learning ) 习题 5.9
- 统计学习精要 (Elements of Statistical Learning ) 习题 5.10
- 统计学习精要 (Elements of Statistical Learning ) 习题 5.13
- 统计学习精要 (Elements of Statistical Learning ) 习题 5.12
- 统计学习导论 Chapter2--What Is Statistical Learning?
- 学习《Statistical Learning》笔记
- ISLR读书笔记(1)统计学习简介
- ≪统计学习精要(The Elements of Statistical Learning)≫课堂笔记(一)
- 使用单例模式实现日志写入,附代码
- 我的React前端工程化模板
- Elasticsearch基本搜索
- c#对xml多属性节点的增加,删除,修改操作源码
- OSI七层模型与TCP/IP五层模型
- Stanford Online-统计学习-ISLR-Ch2-Statistical Learning
- 《Linux内核设计与实现》读书笔记(六)- 内核数据结构
- AS报Failed to resolve: junit:junit:4.12错误正确的解决方法
- [BZOJ3670][NOI2014]动物园(KMP)
- Python3读取深度学习CIFAR-10数据集出现的若干问题解决
- hackerrank Collections.OrderedDict()
- 测试报告主要内容
- Plugin with id 'com.novoda.bintray-release' not found的解决方法
- QT循环队列实时处理数据(二)