KNN算法总结

来源:互联网 发布:京东店铺怎么优化 编辑:程序博客网 时间:2024/05/20 15:57
1K-邻近算法(KNN)

工作原理:

存在一个样本训练集,并且每个样本集中每个数据都存在标签。当输入没有标签的新数据时,将新数据的每个特征与样本集中数据对应的几个特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。

具体实现:
1、计算已知类别中的点与当前点的距离;
2、按照距离递增次序排序;
3、选出与当前点距离最小的的K个点;
4、确定k个点钟所在类别出现的频率;
5、返回前K个点出现频率最高的类别作为当前点的预测分类。
优缺点:
优点:精度高、对异常值不敏感、无数据输入假定。
缺点:计算复杂度高、空间复杂度高。
适用范围:数值型和标称型。
0 0
原创粉丝点击