聚类和EM算法
来源:互联网 发布:1元cn域名注册 编辑:程序博客网 时间:2024/06/05 05:10
聚类是一种无监督学习,它通过对无标记训练样本的学习来寻找这些数据的内在性质。
聚类的思想:将数据集划分为若干个不相交的子集(簇),每个簇对应一类,但通常聚类算法不会告诉你这些簇分别代表什么意义,只是这样分成这些不相交的簇。
聚类的作用:
- 作为一种探索性分析方法,分析数据的内在性质,寻找数据的分布规律
- 作为分类的预处理过程,并不直接数据分析,首先对需要分类的数据进行聚类,然后对聚类出的结果的每个簇上,进行分类,实现数据的预处理
一. 聚类的有效性指标
聚类的有效性指标(Cluster Validity Index,CVI)用来度量聚类的效果。希望相似的样本尽量在同一簇,不相似的样本尽量在不同的簇。
聚类的有效性指标分为两类:1. 外部指标:由聚类结果与某个参考模型进行比较 2.内部指标:直接参考聚类结果,并不利用任何参考模型
二. 距离度量
1. 闵可夫斯基距离
当p =2时,闵可夫斯基距离就是欧式距离
当p =1时,闵可夫斯基距离就是曼哈顿距离
2.VDM距离
三. 原型聚类
原型聚类(prototype-based clustering)是假设聚类结构能通过一组原型进行刻画。常用的原型聚类有:K均值算法KMeans,高斯混合聚类Mixture-of-Gaussian
3.1 K均值算法KMeans
a . 算法步骤
这个以后整理
3.2 高斯混合聚类Mixture-of-Gaussian
XXXX. 小结
阅读全文
0 0
- 聚类和EM算法
- K-Means聚类和EM算法复习总结
- K-Means聚类和EM算法复习总结
- EM聚类算法简介
- EM聚类算法(一)
- EM聚类算法(二)
- EM算法和FA
- EM算法和MM算法
- EM聚类算法matlab实现
- 基于EM算法的文本聚类
- 浅析K均值聚类和EM最大期望算法本质
- EM算法与混合高斯模型聚类算法
- 【机器学习算法模型】聚类算法——EM
- EM算法和GMM算法(五)
- EM算法与高斯混合聚类
- K-means聚类算法背后的EM思想
- 混合高斯模型和EM算法
- 高斯混合模型和EM算法
- Java9 进程API
- Spring 学习(三)注解装配
- Gym 101512K
- LeetCode Week3
- 学习VUE2.0入门到进阶路线推荐
- 聚类和EM算法
- 利用ztree实现树搜索
- TCP和UDP的区别
- Unity Movement AI (二)
- bootstrap网格布局原理解析
- java任务--打印时间
- Memcache的分布式介绍
- CNN的一些基本知识,以后有需要可以看看
- jq代码学习1——《锋利的JQUERY》导航栏