kNN

来源:互联网 发布:mac pro删除文件 编辑:程序博客网 时间:2024/06/18 05:12

knn邻近算法(不完善的博客)

我个人觉得邻近就像是一种“物以类聚,人以群分”的思想

我们给未知数据分类,拿一个已知分类的样本空间去匹对,找和这个未知数据相似的数据,认为他们是一个类,就将这个数据分为这个类

但是划分这个类不是一个数据可以划分出来的,所有我们用一个大小为K的子集来标识和这个数据相似的样本数据,这样缩小了特殊样本对分类的影响,同时也扩大了在样本空间占比重的数据对分类的影响,所以如何选取K值是一个问题?

《机器学习实战》书上衡量数据与样本的相似度的方式是计算欧氏距离,但是我在想是不是用不同的距离公式也可以计算相似度?不同的相似度计算方式是不是也会在某种程度上影响数据的分类


0 0
原创粉丝点击