机器学习笔记11——无监督学习之k-means聚类算法
来源:互联网 发布:windows update 安装 编辑:程序博客网 时间:2024/06/04 00:24
还记得在监督学习的过程中,经常出现这样一幅图
在监督学习中,训练集的数据都含有标签,并且可通过标签对数据进行分类,并且知道正确的答案。而在无监督学习中,数据集中的数据没有标签,对其进行分类也没有答案,只能通过聚类的方式进行分类,这就是无监督学习。
接下来我们将介绍无监督学习的第一个算法,k-means聚类算法。
k-means聚类算法
在聚类问题中,给定一组训练集合
k-means聚类算法的步骤如下:
初始化几个聚类中心,随机选取几个n维向量
μ1,μ2,...,μk 重复执行直到收敛:{
对于每一个训练样本
i ,使得:对于每个聚类中心
j ,使得:
}
在上述的算法中,
算法第二步的循环中有两个步骤,1.为每个训练样本
图中显示了k-means算法的执行过程。训练样本用点来表示,聚类中心用“X”表示。图(a)是原始的数据集,(b)是随机初始化聚类中心(c-f)显示了两次迭代k-means聚类算法的结果,在每一次迭代中,我们将每个训练样本分配给离该点最近的聚类中心(图中相同的颜色代表属于同一聚类中心);之后移动每一个聚类中心到所有分配到该中心的点的均值。
那么k-means聚类算法一定保证收敛吗?答案是肯定的,在某种意义上来说。
让我们通过定义偏差函数来证明这一结论:
其中,
偏差函数
混合高斯模型与EM算法
这一小节将讲述针对密度估计的EM(Expectation-Maximization)算法。
这一部分讲的很高深,听得很迷茫,有些东西并没有理解到位。因此在此引用比较好的对混合高斯模型以及EM算法讲述到位的博文,通过对这两篇博文的理解,相信大家会有一个较为全面的知识结构。
[1] http://www.cnblogs.com/AndyJee/p/3732766.html
[2]http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html
- 机器学习笔记11——无监督学习之k-means聚类算法
- 机器学习笔记:K-Means无监督聚类算法
- 非监督学习之k-means聚类算法——Andrew Ng机器学习笔记(九)
- 无监督学习之K-means算法
- 机器学习--K-means算法(聚类,无监督学习)
- 机器学习算法---无监督学习,k-means聚类
- K-means聚类算法(无监督学习算法)
- 机器学习--无监督学习之K-means聚类方法
- 王小草【机器学习】笔记--无监督算法之聚类
- 【机器学习算法-python实现】K-means无监督学习实现分类
- 机器学习——聚类(clustering):K-means算法(非监督学习)
- 机器学习聚类算法——K-means聚类
- 【opencv、机器学习】聚类算法——K-means
- 机器学习之聚类算法/Bisecting K-Means算法
- 机器学习之聚类算法——K-Means算法
- 斯坦福大学公开课 :机器学习课程(Andrew Ng)——9、无监督学习:K-means Clustering Algorithm
- 机器学习:k-Means聚类算法
- 机器学习-K-means聚类算法
- 读写序列(pickle)
- 朴素贝叶斯分类器(Navie Bayesian Classifier)中的几个要点(一)
- ShareSDK分享集成详细过程
- 用cmd命令行操作数据库的一些基本命令。
- 计算机网络漫谈之IP数据包
- 机器学习笔记11——无监督学习之k-means聚类算法
- spring mvc接受list数组
- c++作业6
- Linux 与存储生态环境
- JAVA是按值传递还是按引用传递的,试试就知道
- 洛谷P2602|bzoj1833 [ZJOI2010]数字计数 数位dp
- JAVA中正则表达式使用方法详解
- Oracle Embedded LDAP Error
- Cocos2dX常见的49种动作(action)