k近邻算法(kNN):简单粗暴
来源:互联网 发布:ajax 返回json eval 编辑:程序博客网 时间:2024/05/21 20:26
kNN(k-nearest neighbors algorithm
)
这是一个简单粗暴的分类器(
Classifier
)算法,分类效果不错,但是对于异常值不敏感,而且算法的复杂度高,每次计算都要遍历整个训练集(Training Data Set
),效率不高.
距离量度相似性 #1
kNN
算法的思想就是把整个训练集在依照特征值坐标轴
标定后,把测试量标定到特征值空间
后,计算测试量与所有训练数据的距离,按照距离从小到大排列,选取距离最小的k个训练点,统计这k个点的Labels
数量最多的Label
就是kNN
得到的分类结果(简单说,就是测试量和训练集的哪个(些)量最相似)。
归一化不同特征量距离 #2
考虑两组特征量(A、B)
,A的数量级为1
,B的数量级为100000
,当用距离来衡量相似性时,B的大小远大于A,所以只有B在起作用,A被忽略了,然而我们是想A、B的权重一样的,所以我们要把A、B归一化,以使得A、B一起决定距离.
归一化公式:
python 代码如下:
def autoNorm(dataSet): minVals = dataSet.min(0) maxVals = dataSet.max(0) ranges = maxVals - minVals normDataSet = zeros(shape(dataSet)) m = dataSet.shape[0] normDataSet = (dataSet-tile(minVals, (m,1)))/tile(ranges, (m,1)) return normDataSet, ranges, minVals
算法构建与应用 #3
手写数字识别demo:
相关参数:
k=15
2.3M训练集数据
准确度较高(与训练集和个人书写习惯相关性大)
0 0
- k近邻算法(kNN):简单粗暴
- K-近邻算法(KNN)
- k近邻算法(kNN)
- KNN(K近邻算法)
- K-近邻算法(KNN)
- K-近邻算法(KNN)
- KNN(K-近邻算法)
- K-近邻算法(KNN)
- kNN(k近邻算法)
- k-近邻算法(kNN)
- k近邻算法(KNN)
- K近邻(KNN)算法
- K近邻(KNN)算法
- K-近邻(KNN)算法
- K-近邻(KNN)算法
- K-近邻算法(KNN)
- k-近邻(KNN)算法
- k-近邻算法(kNN)
- 堆和栈
- 谈谈MVC模式
- 了解详情
- meta标记用于定义文件信息
- (暴力55分+卡常95分补全版)NOIP 2015 D2 T3运输计划
- k近邻算法(kNN):简单粗暴
- Socket的应用(egret)
- Machine Learning学习记录 第一天
- 基于axis的webService的创建
- 1426: 收集邮票
- 电影
- jquery橡皮擦插件使用 图片适配屏幕大小
- B. Cormen — The Best Friend Of a Man
- Goods transportation