k-means算法学习
来源:互联网 发布:深圳华夏软件学校招生 编辑:程序博客网 时间:2024/04/30 11:31
k-means算法是数据挖掘十大经典算法之一。
首先选择一个参数k,代表k次迭代,选择要分类的类数c,随机选择c个点,计算其他点到这c个点的距离,归为距离最近的中心点,然后计算每个类的均值、中值等,重新划分中心点,当分类后的结果与上一次的结果相差不大时,结束。
算法流程:
输入:k,data[n]
1、选择k个初始中心点,例如c[0] = data[0]......c[n-1] = data[n-1]
2、对于data[0]...data[n-1],分别与c[0]...c[n-1]进行距离比较,假定与c[i]的距离最小,就标记为i
3、对于所有标记为i的点,重新进行计算c[i] = (所有标记为i的data[j]之和) / 标记为i的个数
4、重复2、3,直到所有c[i]值的变化即归类的变化小于给定的阈值
坐标可以是任意维度的,例如分类药物,对药物进行特征提取,第一个为weight index,第二个为ph,则建立的为二位坐标系,但注意的是,一定要量化特征为数字,然后构建向量空间。
优点:速度快,简单
缺点:结果依赖于初始点的选择,容易陷入局部最优解
0 0
- k-means算法学习
- 机器学习--K-means算法
- 机器学习--K-means算法
- K-Means算法学习笔记
- 【机器学习】K-Means算法
- 学习笔记- K-means算法
- 机器学习:k-means算法
- 机器学习之K-means算法:深入浅出K-Means算法
- 机器学习算法 之 K-Means聚类
- 机器学习之K-means算法
- 机器学习经典算法9-k-means
- 【机器学习】K-MEANS算法探究
- 机器学习中的算法:K-means聚类
- hadoop学习--K-Means算法实现
- hadoop学习--K-Means(聚类算法)
- 机器学习:k-Means聚类算法
- 机器学习算法-K-means聚类
- K-means聚类算法学习笔记
- 【5002】排版问题
- 屏幕类,用于全屏程序&显示任务栏
- 浮点型 比较
- 抢红包背后的技术点
- liferay中自定义字段及部分路由说明
- k-means算法学习
- Codeforces Round #379 (Div. 2) -- D. Anton and Chess (if else 的水题)
- Python 内置函数 locals()和 globals()
- 双链表的插入学习(C和指针)
- Unity3D都有哪些坑
- TCP/IP和UDP的基础理解(1)
- 使用conlleval.pl对CRF测试结果进行评价的方法
- 扯淡nginx的sendfile零拷贝的概念
- [基于ionic开发]开发教程lesson01之环境安装