机器学习----降维与度量学习(k邻近学习)
来源:互联网 发布:arp 添加网关mac 编辑:程序博客网 时间:2024/05/22 02:43
kNN
k邻近,k-Nearest Neighbor,kNN;是懒惰学习(lazy learning)的代表。所谓懒惰学习就是没有没有显式训练过程,只是把训练数据保存起来,用的时候直接再算出结果就行了。具体算法如下:
给定测试样本,基于某种距离度量找出训练集中与最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测;若是分类问题就可以用投票法确定最后的结果,若是回归问题就可以用平局法。但是最后结果跟k选取有关系:
可以看出k=1的时候,判定为+,为3的时候判定为-,为5的时候判定又为+。
给定测试样本x,若其最近邻样本为z,则最近邻分类器的出错概率为:
假设样本独立同分布,且对任意x和任意小的正数
怎么样是不是有点惊讶,最近邻分类器虽然简单,但是它的泛化错误率不超过贝叶斯最优分类器的错误率的两倍。
低维嵌入
我们讨论错误率的时候有个假设,在样本x附近
如图所示我们把三维空间中的点降维成了两维。可以直观的感受到,我们这样的降维对分类任务来说没有一丝影响反而更加好算了。即人们观察到数据虽是高位的,但是与学习任务密切相关的也许仅是一个低维分布,即高维空间中的一个低维“嵌入”。我们下一讲说说降维最经典,我最喜欢的算法PCA(Principal Component Analysis)。
0 0
- 机器学习----降维与度量学习(k邻近学习)
- [机器学习]k-邻近算法
- 机器学习----降维与度量学习(等度量映射和度量学习)
- 机器学习-降维与度量学习
- 机器学习与深度学习(二) k最邻近分类算法 (K-Nearest Neighbor) KNN
- 机器学习----降维与度量学习(PCA)
- 【机器学习实战】K-邻近算法
- 机器学习实战之K-邻近算法
- 机器学习之K邻近算法 (KNN)
- 机器学习-学习笔记 降维与度量学习
- 机器学习实战笔记(k邻近算法)
- 机器学习(KNN-K最邻近分类)
- k-邻近算法学习
- 关于机器学习k邻近算法的学习笔记
- 机器学习学习笔记2---k邻近算法的实现
- python3与机器学习实践---1、最简单的K-邻近算法(k-Nearest Neighbor,KNN)
- 机器学习(二) 评估与度量
- 【机器学习——K最邻近算法】
- 解决win10下配置matlab接口的GPU版Caffe时常遇到的一些错误
- 欢迎使用CSDN-markdown编辑器
- Graph based Segmentation
- flannel 实战与源码分析(三)
- LeetCode 61. Rotate List
- 机器学习----降维与度量学习(k邻近学习)
- 华为portal2.0协议封装
- Linux下C++,matlab混合编程
- python 字符集编码检测(转载修改)
- 指针之美
- servlet实现form表单的文件上传
- recyclerView的基础使用
- 线程与进程
- Android第三方接入 Udesk