k-均值:一种基于型心的技术
来源:互联网 发布:实体店出票软件 编辑:程序博客网 时间:2024/05/24 00:58
1.一些概念
对于给定的数据集D,将D聚类成k个簇c1,c2,...ck;
k-均值算法用簇ci的型心代表簇,把簇型心定义为簇内点的均值,
对象p到型心ci的距离用欧式距离度量dist(p,ci),
簇ci的质量用簇内变差度量,它是ci中所有对象和形心ci之间的误差的平方和,定义为:
E=∑ki=1∑dist(p,ci)2p∈Ci
2.k-均值算法执行流程:
首先在D中随机选择k个对象,每个对象代表一个簇的初始均值,根据欧式距离将剩余对象分配到最相似的簇;
然后对每个簇使用上次迭代分配到的对象计算新的均值,然后使用更新后的均值作为新的簇中心,重新分配所有对象;
迭代继续,直到分配稳定,即本轮形成的簇与上一轮形成的簇相同。
它通常止于局部最优解,结果可能依赖于初始中心点的选择,实践中为了得到好的结果,通常以不同的初始簇中心,多次运行。
3.适用条件及缺点:
仅当均值有定义时才能使用,例如当涉及标称属性时均值可能无定义;
要求用户必须给出要生成的簇数;
不适于发现非凸形的簇或者大小差别很大的簇,他对噪声和离群点敏感。
∑
∑
阅读全文
0 0
- k-均值:一种基于型心的技术
- k-均值:一种基于型心的技术
- k均值聚类+基于核的k均值聚类+C++实现
- 基于R语言的支持向量机(SVM)+k均值(K-means)简单实现
- K均值的算法步骤
- 一种网格去噪算法(基于平均面法向的均值滤波)
- 5-Spark高级数据分析-第五章 基于K均值聚类的网络流量异常检测
- 划分聚类分析: K均值和基于中心点的划分(PAM)
- 一种基于RSI和K线的择时策略
- K均值
- k均值
- k-均值
- K均值
- K-均值
- k-均值算法的java实现
- K均值算法的c语言实现
- DM里的K均值算法
- 聚类分析的K均值算法(Python实现)
- Python 环境搭建
- [BZOJ2423][HAOI2010]最长公共子序列(DP)
- 朴素贝叶斯分类器的应用 Naive Bayes classifier
- Android Studio 快捷键整理速查
- jsp页面双击td变成可编辑状态,焦点丢失保存
- k-均值:一种基于型心的技术
- 《怎样打开小米手机(已升级至MIUI8)的开发者选项》
- cropper.js 实现裁剪图片并上传(移动端)
- RelativeLayout 布局常用属性
- mybatis之resultMap的关联查询
- [读书笔记]第二章 横过深谷的吊桥 常从一根细线栓个小石头开始
- mysql 定时触发器
- INI 文件操作
- 容器|集合