机器学习教程之2-k近邻模型的sklearn实现
来源:互联网 发布:mysql execute into 编辑:程序博客网 时间:2024/06/13 22:02
0.概述
1)k近邻法通过少数服从多数的原则进行预测;
2)k近邻法不具有显式的学习过程;
3)k紧邻法的三个基本要素:k值得选择、距离度量和分类决策规则。
优点:
简单好用,容易理解,精度高,理论成熟,既可以用来做分类也可以用来做回归;
可用于数值型数据和离散型数据;
训练时间复杂度为O(n^2);无数据输入假定;
对异常值不敏感。
缺点:
计算复杂性高;空间复杂性高;
样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少);
一般数值很大的时候不用这个,计算量太大。但是单个样本又不能太少,否则容易发生误分。
最大的缺点是无法给出数据的内在含义。
1.k近邻算法
2.k近邻模型
2.1模型
下图分为两类:
2.2距离度量
距离度量方式有很多种,选择的度量方式不同,判断的最近邻点也就有可能不同。
2.3k值得选择
k值得减少就意味着整体模型变得复杂,容易发生过拟合;
k值得增大意味着整体模型变得简单,预测容易发生错误。
2.4分类决策规则
多数表决规则等价于经验风险最小化。
3.k近邻法的实现:kd树
3.1构造kd树
3.2搜索kd树
4.代码
我的github上的代码:
(1)Nearest Neighbors API的使用
(2)使用scikit-learn的KNN算法进行分类的一个实例,使用数据集依是iris(鸢尾花)数据集
(3)sklearn实现kaggle Digit Recognizer
5.总结
6.参考资料
[1] 统计学习方法 李航
[2] sklearn官方教程-nearest neighbor
[3] sklearn官方教程-Nearest Neighbors API
[4] scikit-learn学习之K最近邻算法(KNN)
[5] 计算Python Numpy向量之间的欧氏距离
[6] Python3《机器学习实战》学习笔记(一):k-近邻算法(史诗级干货长文)
[7][Python学习] python 科学计算库NumPy—tile函数
- 机器学习教程之2-k近邻模型的sklearn实现
- 机器学习教程之10-聚类(Clustering)-K均值聚类(K-means)的sklearn实现
- sklearn学习之K近邻算法
- 机器学习教程之9-SVM的sklearn实现
- 机器学习之K近邻
- 机器学习之k近邻
- 【机器学习实践(2)】K近邻(KNN)模型
- 机器学习教程之2-线性回归(linear regression)的sklearn实现
- 【2】机器学习之兄弟连:K近邻和K-means
- 机器学习之K-近邻算法代码实现
- 【机器学习】K-近邻算法的Python实现
- 机器学习笔记1-k近邻算法的实现
- 机器学习实战-k近邻的概述与实现
- 《机器学习实战》学习笔记之k-近邻算法2
- 机器学习基础 维基翻译 超参数选择 K近邻法 及简单的sklearn例子 分类:机器学习Sklearn
- 机器学习----笔记之k-近邻算法(2)
- 机器学习实战之K近邻
- 机器学习笔记之K近邻算法
- hdu 4507 数位DP(求和类型)
- html5 新元素和Canvas
- android自定义view-利用Paint 的 Xfermode 把图片撸成各种形状
- 访问WEB-INF目录中的JSP文件
- hdu1285 确定比赛名次【拓扑排序】
- 机器学习教程之2-k近邻模型的sklearn实现
- OGNL基础
- CentOS 7常用工具安装
- nginx 多层代理 参数丢失
- Cows POJ
- android LayoutInflater
- Struts2(十三):超链接实现动态加载国际化资源文件
- clang-format 格式化工具简易配置
- 第四篇 :微信公众平台开发实战Java版之完成消息接受与相应以及消息的处理