程序博客网 > 淘宝网切糕

EM算法初探

来源：互联网发布：淘宝网切糕编辑：程序博客网时间：2024/05/20 18:44

说是初探，然而并没有什么干货，开一个页面，等学到一定深度来整理。
前言
在概率模型中，如果变量都是观测变量（observable variable），则可以直接用极大似然估计法活着贝叶斯估计方法，但是变量除了有observable variable，还有潜在变量（latent variable），则需要采用EM（expectation maximization algorithm）算法。
三硬币模型

很容易得出：

P (Y | θ) = \prod j = 1 n [π p y j (1 - p) 1 - y j + (1 - π) q 1 - y j (1 - q) y j]

P (Y | θ) = \sum z P (Z | θ) P (Y | Z, θ)

其中Y是观测数据，Z是中间变量
求

θ=argmaxθlogP(Y|θ)，也就是求模型参数

θ=(π,p,q)的极大似然估计。
EM算法
input:

YZP(Y,Z|θ)P(Z,Y|θ)
output:

θ
(1)选择初值

θ(0)，开始迭代
(2)E：记

θ(i)为第

i次参数

θ的估计值，在第

i+1次迭代的E步，计算:

Q (θ, θ (i)) = E z [l o g P (Y, Z | θ)] = \sum z l o g P (Y, Z | θ) P (Z | Y, θ (i))

(3)M:

θ(i+1)=argmaxθQ(θ,θ(i))
(4)重复(2)(3)，直到收敛
参考文献
李航《统计学习方法》
从最大似然到EM算法浅解
K-means聚类算法

0 0

淘宝网切糕

淘宝网切糕

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子杨丽花歌仔戏薛丁山杨丽花歌仔戏杨家将杨丽花七世夫妻歌仔戏杨丽苹十面埋伏杨丽萍杨丽萍别墅杨丽萍整容前后照片杨丽萍减肥杨丽萍大型舞剧孔雀杨丽萍孔雀巡演杨丽萍舞剧孔雀杨丽萍瘦身杨丽萍的家杨丽萍健身舞杨丽萍化妆品杨丽萍老公杨丽萍形体舞杨丽萍指甲杨丽萍舞台剧杨丽萍的指甲杨丽萍舞蹈杨丽萍舞剧孔雀杨丽萍孔雀舞剧孔雀杨丽萍舞剧杨丽萍舞剧杨丽萍近期演出杨丽萍洱海别墅杨丽萍巡演雀之灵杨丽萍杨丽萍孔雀舞剧杨丽萍巡演杨丽萍家杨丽萍简介杨丽萍月亮之上杨丽萍万物生杨丽萍服装专卖店杨丽萍孔雀杨丽萍的老公广场杨丽萍杨丽萍近照杨丽萍民族风服饰