kNN

来源：互联网发布：mac pro删除文件编辑：程序博客网时间：2024/06/18 05:12

knn邻近算法（不完善的博客）

我个人觉得邻近就像是一种“物以类聚，人以群分”的思想

我们给未知数据分类，拿一个已知分类的样本空间去匹对，找和这个未知数据相似的数据，认为他们是一个类，就将这个数据分为这个类

但是划分这个类不是一个数据可以划分出来的，所有我们用一个大小为K的子集来标识和这个数据相似的样本数据，这样缩小了特殊样本对分类的影响，同时也扩大了在样本空间占比重的数据对分类的影响，所以如何选取K值是一个问题？

《机器学习实战》书上衡量数据与样本的相似度的方式是计算欧氏距离，但是我在想是不是用不同的距离公式也可以计算相似度？不同的相似度计算方式是不是也会在某种程度上影响数据的分类

0 0