程序博客网 > 淘宝人参怎么这么便宜

聚类 K-means

来源：互联网发布：淘宝人参怎么这么便宜编辑：程序博客网时间：2024/06/06 02:05

K-means 是经典的聚类算法。

1.思想

给定 {n,k,{x(1),...,x(n)}}, 它们分别是样本个数，要划分为k类，和样本点。

随机标出k个质心，对每个样本计算出离它最近的质心，这样就得到了最初的划分。
根据已有的划分重新计算每类样本的质心，于是得到了k个质心的新的位置。
对每个样本计算出离它最近的质心，这样就得到了迭代后的划分。
重复步骤2与步骤3，直至质心的位置变化相对稳定。此时得到了最终的划分。

这里写图片描述
图1-1 K-means 迭代步骤的图解

该图中的k=2，质心用不同颜色的×表示。

1.2 复杂度

O(point_count * dimension * center_count * loop), 即样本个数 * 样本维度 * 聚类k的值 * 循环次数.

2. spherical k-means

spherical ,[‘sferɪk(ə)l], adj. 球形的，球面的；天体的
普通的距离度量用的是 Euclidean Distance, 使用 cosine similarity 的话, 那就是 spherical k-means.

3.备注

Q：随机选取质心的位置，会不会影响最终的划分？
A: 待解答。应该是会的.

Q：如何证明随机选取质心位置，最终一定会收敛?
A : 待解答，先参考他人博客

Q: 怎么选取一批样本的质心位置？
A: 样本都是用向量表示，那么用简单的平均法x(centrioid)j=∑ix(i)j可以求得质心第j维分量的大小。

参考

quora, How-can-I-use-cosine-similarity-in-clustering-For-example-K-means-clustering

阅读全文

0 0

淘宝人参怎么这么便宜

淘宝人参怎么这么便宜

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子故事卖火柴的小女孩卖火柴的小女孩绘本假如卖火柴的小女孩作文卖火柴的小女孩讲故事卖火柴的小女孩卖火柴的小女孩练习卖火柴的小女孩安徒生卖火柴的小女孩习题童话故事卖火柴的小女孩改编卖火柴的小女孩童话卖火柴的小女孩卖火柴的小女孩导入卖火柴的小女孩童话故事卖火柴的小女孩现实卖火柴的小女孩木偶剧卖火柴的小女孩答案卖火柴的小女孩意义卖火柴的小女孩节选卖火柴的小女孩日记卖火柴的小女孩内容卖火柴的小女孩心得连环画卖火柴的小女孩卖火柴的小女孩书籍课件卖火柴的小女孩卖火柴的小女孩特点卖火柴的小女孩总结卖火柴的小女孩鲜网仿写卖火柴的小女孩什么的卖火柴的小女孩卖火柴的小女孩观后感卖火柴的小女孩续集银桃花卖火柴的小女孩火材人材火火紫人人小火才人火树火棘树火琉璃是什么树超级神血脉树火