kNN邻近算法逻辑思路和可分析示例思考?

来源:互联网 发布:python txt 读写 编辑:程序博客网 时间:2024/05/16 13:40

KNN邻近算法原理:

1、KNN主要是通过已知分类,然后通过未知的数据与其进行距离测算,然后通过给定的距离范围里面包含的数据量K,进行排序,数据距离最近的K个数里面,类型数目最多的就是校验的样本的类型。

2、然后通过使用所有列的最大数据减去最小数,然后样本除于这个最大间距,来实现数据归一化,防止样本数据值相差太大,导致数据误差偏大,然后重新计算测试样本。

3、其次在有一个数据源时,利用10%作为样本进行测试,另外90%作为训练,样本用来进行测试错误率是不是在你需要的范围,训练集用来最后测试你的输入值,来通过整体数据源的准确率来判断你的分类结果是否正确。

实践的案例有哪些?

1、手写数字识别:通过转换成数字来进行判断。

2、网络约会类型识别:通过各类型转换成数字,然后通过输入新的数字来进行判断是否是可行分类。

3、各优惠券金额产生的商品单价对应的职业类型识别:通过指标转换,来输入优惠券查看可能的类型。