西瓜书《机器学习》课后答案——chapter10 降维与度量学习
来源:互联网 发布:fastdfs nginx 400 编辑:程序博客网 时间:2024/06/04 20:05
10.1 西瓜书《机器学习》课后答案——chapter10 _10.1 KNN算法
10.2 令err,err∗分别表示最近邻分类器与贝叶斯最优分类器的期望错误率,试证明:
解答:
不知道这里所谓的期望错误率是指什么。在原论文Nearest Neighbor Pattern Classification. 1967.中,定义的是NN条件风险
贝叶斯条件风险与贝叶斯风险:
假设已知条件分布
这个式子可以这样理解:实例的类别并不是唯一确定的,而是在所有类别上有一个分布。如果把实例划分为类别j,那么损失为L(i,j)的期望损失。
贝叶斯决策规则会把实例x分类到条件风险最小的类别,对应的条件风险称为Bayes条件风险:
Bayes条件风险的期望称为Bayes风险:
这是所有的分类器所能达到的最小风险。
如果损失函数为0-1损失函数,则
NN条件风险与NN风险:
给定训练数据
如果所有的训练样本对都是随机变量,可以定义NN条件风险为:
在
把
根据柯西-施瓦兹不等式:
可知
所以
代入(7)中得:
定义n-samples NN风险:
NN风险:
则
不等式右边得证。
因为
所以
所以
不等式左边得证。
10.3 在对高维数据降维前应该先进行“中心化”,常见的方法是将协方差矩阵
解答:
为什么题目中非得说对协方差矩阵做变换,为什么不直接说对X做变换
对X做变换
10.4 在实践中,协方差阵
解答:
(1)首先可以这样做,肯定是因为两者确实等价
假设A是一个
称为A的奇异值分解,其中
可以推出U的列向量
当
m<n 时:(AAT)[u1,u2,⋯,um]=[σ21u1,σ22u2,⋯,σ2mum],
于是有(AAT)ui=σ2iui,i=1,2,⋯,m,(3)
所以U的列向量ui,i=1,⋯,m 是AA^T的特征向量。当
m>n 时:(AAT)[u1,u2,⋯,um]=[σ21u1,σ22u2,⋯,σ2nun,0,⋯,0],
于是有(AAT)ui=σ2iui,i=1,2,⋯,n,(4)
所以U的列向量ui,i=1,⋯,n 是AAT 的非零特征值对应的特征向量,ui,i=n+1,⋯,m 是AAT 的零特征值对应的特征向量。
综上,U的列是
类似地,可以证明V的列是
(2)这样做节省计算和存储成本
协方差矩阵
可以看到协方差矩阵随随便便就占了几个G,如果特征空间维数再高一点,那么占用的内存远远超过我们的计算机拥有的内存。这个矩阵都存不下,怎么求特征分解呢?
X的SVD分解,其实也是需要存储一个和协方差矩阵大小相同的矩阵的。
应该采用以下方法求协方差矩阵的特征值和特征向量。我们知道,矩阵
左右两边同时乘以X,得到
故
所以可以先求出
10.5 降维中涉及的投影矩阵通常要求是正交的,试述正交、非正交投影矩阵用于降维的优缺点。
解答:
正交投影矩阵可以保证投影到的低维特征空间的每个维度是不相关的,降低特征之间的耦合性。
10.6 西瓜书《机器学习》课后答案——chapter10_10.6 PCA
10.7 试述核化线性降维与流形学习之间的联系以及优缺点。
解答:
核化线性降维与流形学习都是非线性降维手段。
核化线性降维首先把数据映射到高维空间中,然后在高维空间应用PCA,得到降维投影矩阵。对于新的样本点,可以直接代入表达式中计算其低维表示;
流形学习通过保持数据在高维空间中的流形结构进行降维,比如Isomap算法保持的是数据点之间的测地距离,LLE算法保持的是局部线性结构。但是Isomap算法无法直接应用到新样本中。
10.8 k近邻图和
10.9 设计一个方法为新样本找到LLE降维后的低维坐标。
解答:
对于新样本,首先计算其高维空间中的k个近邻,然后通过最小重构误差,得到线性重组系数。然后在低维空间中,对近邻应用同样的线性组合,得到新样本在低维空间中的表示。
10.10 试述如何确保度量学习产生的距离能满足距离度量的四条基本性质。
解答:
这个是想让证明度量矩阵
目前暂时不知道。
- 西瓜书《机器学习》课后答案——chapter10 降维与度量学习
- 西瓜书《机器学习》课后答案——chapter10 _10.1 KNN算法
- 西瓜书《机器学习》课后答案——Chapter1
- 西瓜书《机器学习》课后答案——Chapter2
- 西瓜书《机器学习》课后答案——Chapter3_3.4
- 西瓜书《机器学习》课后答案——Chapter3_3.3
- 西瓜书《机器学习》课后答案——Chapter3_3.5
- 西瓜书《机器学习》课后答案——Chapter3
- 西瓜书《机器学习》课后答案——chapter5
- 西瓜书《机器学习》课后答案——chapter5_5.5
- 西瓜书《机器学习》课后答案——chapter5_5.7
- 西瓜书《机器学习》课后答案——chapter5_5.10
- 西瓜书《机器学习》课后答案——chapter6
- 西瓜书《机器学习》课后答案——chapter6_6.2
- 西瓜书《机器学习》课后答案——Chapter6_6.3
- 西瓜书《机器学习》课后答案——chapter7
- 西瓜书《机器学习》课后答案——chapter7_7.3
- 西瓜书《机器学习》课后答案——chapter9
- 160个练手CrackMe-020
- C231n-KNN-assignment1-完全代码及注释
- spring mvc 用cookie和拦截器实现自动登录(/免登录)
- python3 类的构造器 __init__
- 微服务权限问题认证方式,简单学习
- 西瓜书《机器学习》课后答案——chapter10 降维与度量学习
- 第九周训练总结(一)
- Linux--机器性能分析
- IOS 截取屏幕截图方法
- Redis的数据类型及操作(一):string类型及操作
- Python模块
- 数据库学习1
- Codeforces Round #442 (Div. 2) F. Ann and Books(莫队)
- 安卓编程之安卓开发初体验