统计学习方法第三章笔记——k近邻法
来源:互联网 发布:淘宝热门工具在哪里 编辑:程序博客网 时间:2024/05/16 18:04
3.1 k 近邻算法
K近邻算法即是对与每一个需要分类的新实例,找出数据集中与它最相似的k个实例,并选取占大多数的分类作为新实例的分类。
3.2 k 邻近模型
其模型主要由3个部分组成:距离的度量、
(1)距离度量:一般选择实例特征的范数。
(2)
(3)分类决策规则:其本质是经验损失最小:
其中,
3.3 k近邻的实现:kd树
kd树是一种快速寻找最邻近节点的算法,该算法分成两步,首先建立kd树,然后根据kd树快速搜寻最邻近节点。kd树的构造过程是把特征空间划分成超矩形的过程。
3.3.1 构造kd树
(1)从第一个开始轮流选取特征分量,找出所有数据中该特征分量的中间值,并且将该数据作为根节点,以该分量垂直于坐标系的超平面划分特征空间,其他节点中特征分量小于中值的在左空间,大于的在右空间。
(2)依次选取下一个特征分量,在左边以及右边的子空间中分别重复第一步,到只剩根节点为止。可以知道,kd树是一个平衡二叉树。
3.3.2 搜索kd树
(1)从根节点开始,按照特征分量的划分依次往下搜索,直到找到叶节点,并认为这个叶节点是“当前最邻近节点”,输入实例与最邻近节点之间的距离即搜索半径。
可以认为整个空间中与实例最相邻的节点一定在以搜索半径为半径的这个超球中。所以剩下要做的事就是在所有与超球相交的特征子空间中进行搜索,找出搜索半径最小的节点。
(2)进行回溯直到根节点,对于回溯的每一个节点作如下检查:
a:这个节点是否比当前最邻近节点更近,如果更近就替换掉它。
b:这个节点的另一个子空间是否与超球相交,如果相交,递归搜索该子空间中与超球相交的子空间,对搜索路径上的节点进行比较,搜索完毕后继续回溯。
3.4 其他
该算法的时间复杂度是
- 统计学习方法第三章笔记——k近邻法
- 统计学习方法笔记,第三章,k近邻法
- 统计学习方法第三章:k近邻法
- 统计学习方法——第三章K近邻
- 统计学习方法——k近邻法
- 统计学习方法阅读笔记:k近邻法
- 统计学习方法笔记:K近邻法
- 《统计学习方法》笔记——K近邻模型
- 统计学习方法——K近邻模型
- [统计学习方法]K近邻法
- 统计学习方法-----k近邻法
- 统计学习方法:k近邻法
- 统计学习方法---k近邻法
- 统计学习方法(第三章)k近邻算法
- 《统计学习方法》学习笔记(三)——K近邻法
- 统计学习方法笔记(3)——k近邻法与kd树
- 统计学习方法笔记(3)——k近邻法与kd树
- 统计学习方法笔记-K近邻(k-NN)
- hdu5612Baby Ming and Matrix games 搜索
- R6010错误:Press Retry to debug the application
- 线程池的四个中断策略
- 析构函数为虚函数
- hdu5613 Baby Ming and Binary image
- 统计学习方法第三章笔记——k近邻法
- 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤
- UGUI- Image拦截Button响应事件
- centos7 防火墙firewalld
- android的Gradle学习目录总结
- CSS创建三角形(小三角)的几种方法
- Android中显式和隐式intent的特点和区别
- Day8使用IDEA 开发spark
- cell的缓存