斯坦福公开课Machine Learning笔记(十)--Mixtures of Gaussians and EM algorithm
来源:互联网 发布:淘宝冻结账户开通 编辑:程序博客网 时间:2024/05/21 17:26
斯坦福公开课Machine Learning笔记(十)–Mixtures of Gaussians and EM algorithm
这系列笔记其实已经手写好, 现在一次性发上来, 主要是怕丢. 内容以Andrew Ng的讲义为主,主要以公式推导与理解为主,引入和介绍省略.对于最后的Reinforcement Learning部分, 由于没有讲义以及对其实在不熟悉, 就没有笔记了(主要还是因为没有讲义).
之前的训练集都是有标记的,k-means是公开课中第一个无标记的算法,其基本思想也很好理解.而这课的EM算法应用很多,先假设了隐变量,其公式推导还是需要慢慢琢磨.
先以高斯混合模型为例:
有隐变量z,
如果知道
Repeat{
E-step:(guess value of
M-step:(update the parameters)
}
以上只是EM的一个特例,高斯模型的一个例子.现在来推导一下EM算法:
先介绍下Jensen不等式:
f是凸函数(
当且仅当
如果
根据Jensen不等式的取等号条件,我们想要的是
从另一个角度来看:
define:
回到高斯混合模型中:
然后分别对
Mixtures of Naive Bayes Model
当我们要对文本进行分类,但是不知道标签,那么使用NB对文本进行分类是文本聚类问题.
这里有m个文本,每个文本表示成n维向量.
这里隐变量
其实EM和k-means的大体思路是差不多的,只是EM可以具体求出密度函数
- 斯坦福公开课Machine Learning笔记(十)--Mixtures of Gaussians and EM algorithm
- Machine Learning—Mixtures of Gaussians and the EM algorithm
- 斯坦福公开课Machine Learning笔记(四)--Generative Learning Algorithm
- 【机器学习-斯坦福】学习笔记11 混合高斯模型(Mixtures of Gaussians)和EM算法
- 斯坦福公开课Machine Learning笔记(九)--The K-means Clustering Algorithm
- 斯坦福公开课Machine Learning笔记(五)--Support Vector Machine
- 斯坦福公开课Machine Learning笔记(六)--Learning Theory
- 斯坦福公开课Machine Learning笔记(八)--Online Learning
- 斯坦福公开课Machine Learning笔记(二)--Classification and Logistic Regression
- 斯坦福公开课Machine Learning笔记(七)--Regularization and model selection
- 斯坦福大学公开课 :机器学习课程(Andrew Ng)——10、无监督学习:Mixture of Gaussians and the EM Algorithm
- 斯坦福公开课Machine Learning笔记(一)--Linear Regression
- 斯坦福公开课Machine Learning笔记(三)--Generalized Linear Models
- 斯坦福公开课Machine Learning笔记(十一)--Factor Analysis
- 斯坦福公开课Machine Learning笔记(十二)--PCA
- 斯坦福公开课Machine Learning笔记(十三)--ICA
- 混合高斯模型和期望最大化算法(Mixture of Gaussians and the EM algorithm)
- 斯坦福的 Machine Learning 公开课,可以注册在线学习
- memset函数解析
- JavaScript: missing ) after argument list,js获取s:property值的问题
- 数据分析基础
- 链表的相关操作
- [PAT] B1038
- 斯坦福公开课Machine Learning笔记(十)--Mixtures of Gaussians and EM algorithm
- 203. Remove Linked List Elements
- Mybatis传多个参数(三种解决方案
- NOIP2007 树网的核 [dfs] [数据结构] [树的直径]
- Java垃圾收集机制
- bzoj2669: [cqoi2012]局部极小值
- [18] Vijos P1845 花匠(贪心)
- 如何上传本地代码到github上
- ubuntu14.04配置Tensorflow环境