PRML读书笔记——采样方法
来源:互联网 发布:超市购物篮数据下载 编辑:程序博客网 时间:2024/06/15 07:43
本章中,我们希望解决的基本的问题涉及到关于⼀个概率分布p(z)寻找某个函数
我们假设,使⽤解析的⽅法精确地求出这种期望是⼗分复杂的。因此,我们采用采样的方法抽取出样本,计算出对应的值
本章的采样方法主要包括:重要采样、拒绝采样、蒙特卡罗采样、吉布斯采样、切片采样和混合蒙特卡罗采样等
基本采样方法
这里,我们研究从一个给定的概率分布中生成随机样本的方法
标准概率分布
这考虑如何从简单的非均匀分布中生成随机数。可以从均匀分布开始,利用变换的方法,形成所需要计算的概率分布,并求出这个概率分布的不定积分的反函数。
假设
这里,y所具有的分布是我们希望的得到的分布形式。对上式积分,有:
它就是
这里存在两个难点:(1)变换
为了对非均匀分布采样,考虑另外的方法:拒绝采样和重要采样,但它们只能处理单变量概率分布的情况。
拒绝采样
拒绝采样的思想是,目前需要采样的概率分布形式复杂,我们引入相对简单的概率分布(提议分布,proposal distribution),这个概率分布能覆盖目标分布,然后直接在提议分布上采样,通过一定的准则选择拒绝还是接受当前的采样值。
假设我们希望从概率分布
z,我们能够很容易计算
现在,我们引入简单的提议分布
则函数
中⽣成⼀个数
么样本被拒绝,否则
一个样本的接受率为
显然,k越大,整体接受率越低,因此k越低越好,但是k有需要满足限制
一般而言,
缺点:因为目标概率分布的情况复杂,找到⼀个较好的提议分布和⽐较函数是⼀件相当困难的事情。此外,接受率随着维度的指数下降是拒绝采样的⼀个⼀般特征。虽然拒绝采样在⼀维或⼆维空间中是⼀个有⽤的⽅法,但是它不适⽤于⾼维空间
重要采样
这种采样方法主要用于估计概率分布的期望。与拒绝采样不同,重要采样不拒绝任何的采样结果,而是给提议分布上的采样结果赋予权重
同样假设直接从
显然,这种采样是非常低小的,因为一般而言,目标概率分布都将它的大部分质量限制在z空间的一个很小的区域,也就是说只有很小部分的样本会对求合适产生贡献。
这里再次引入提议分布
这里,
考虑到归一化因子难以求解,因此,一般定义
则:
缺点:它具有产⽣任意错误的结果的可能性,并且这种错误⽆法检测。这是因为重要采样⽅法的成功严重依赖于采样分布
采样-重要性-重采样
这个⽅法有两个阶段。在第⼀个阶段,
可以证明,⽣成的L个样本只是近似地服从
马尔科夫链蒙特卡罗(MCMC)
前面的基本采样方法在高维空间有很大的局限性。MCMC可以很好地应对样本空间维度的增长,MCMC的采样时针对时序状态的。
首先我们从提议分布中采样,记录下当前状态
这里举一个例子,说明MCMC算法主要想解决的问题。考虑一个随机游走的例子。它有整数组成的状态空间z,概率为;
其中
马尔科夫链
这里主要分析马尔科夫链的基本性质——细节平衡性质(detailed balance)
首先,马尔科夫链具有齐次性,即下一时刻的状态只受当前状态的影响。
因此,边缘概率为:
对于一个概率分布来说,如果马尔科夫链中的每⼀步都让这个概率分布保持不变,那么我们说这个概率分布关于这个马尔科夫链是不变的,或者静⽌的。对于⼀个转移概率为
细节平衡性质:是确保所求的概率分布
满足细节平衡就能收敛到平稳分布,如下:
这里就解释细节平衡得必要性,如果构造的马尔科夫链是的所求的概率分布是不变的,我们就能控制它收敛到指定的分布
Metropolis 算法
我们假定提议分布是对称的,即
可以这样实现:在单位区间(0, 1)上的均匀分布中随机选择⼀个数u,然后如果
如果候选样本被接受,那么
然后从概率分布
Metropolis-Hastings 算法
它是基于metropolis的改进,这里提议分布不再是对称的,而且接受概率的形式发生改变。在算法的步骤
这样设计的理由是,形成的马尔科夫链是满足细节平衡的,也即是不变的马尔科夫链。即使随机游走,也能确保收敛到平稳分布。
吉布斯采样
吉布斯采样是马尔科夫链蒙特卡罗算法的具体情形
考虑我们想采样的概率分布
一般步骤如下:
(1)初始化
(2)对于
采样
zτ+11∼p(z1|zτ2,zτ3,...zτM) 采样
zτ+12∼p(z2|zτ+11,zτ3,...zτM)
… …
- 采样
zτ+1j∼p(zj|zτ+11,zτ+12,...zτ+1j−1,zτj+1,...,zτM)
… …
- 采样
zτ+1M∼p(zM|zτ+11,zτ+12,...zτ+1M−1)
切片采样
因为Metropolis算法对步长敏感。步长小,会产生随机游走,算法很慢;步长大,拒绝率较高,算法低效。切片采样替工了可以自动调节步长来匹配分布特征的方法。
这种采样方法使用额外的变量u对z进行增广,然后从联合的
则z的边缘概率分布为:
我们可以通过从
显然,得到u后,直接从穿过概率分布的切⽚中采样很困难。近似方法如下:
从⼀个包含
混合蒙特卡罗采样
Metroplolis算法的主要局限是受步长影响,具有随机游走的行为。混合蒙特卡罗算法将哈密顿动态系统与Metropolis算法相结合,消除与离散化过程关联的任何偏差。
算法使⽤了⼀个马尔科夫链,它由对动量变量
这里的H就是哈密顿动态系统的总能量,为势能和动能之和。感觉这部分没看懂,所以具体推导和分析就省略了
- PRML读书笔记——采样方法
- PRML读书笔记——神经网络
- PRML读书笔记(1)——introduction
- PRML读书笔记(2)——Probability Distribution
- PRML读书笔记——稀疏核机
- PRML读书笔记——图模型
- PRML读书笔记——连续潜在变量
- PRML读书笔记——顺序数据
- PRML读书笔记——组合模型
- PRML读书笔记——Kernel Methods
- PRML读书笔记——概率分布
- PRML读书笔记——线性回归模型
- PRML读书笔记——线性分类模型
- PRML读书笔记——混合模型与EM
- PRML读书笔记(1)——第三章 线性回归模型
- prml 图模型读书笔记
- PRML读书笔记:框架
- PRML 读书笔记 chapter1 Introduce
- 005-023-Merge k sorted lists 归并K个有序的链表
- 2017.4.15模拟赛总结
- 如何安装Composer
- 多线程操作例题
- swustoj(字符串查找(0448))
- PRML读书笔记——采样方法
- tcpdump+wireshark的使用
- Oracle数据库被锁住问题
- 数据库几个操作的专业叫法
- GPLT-古风排版
- Machine Learning第三讲[Logistic回归] --(二)Logistic回归模型
- iOS中respondsToSelector方法的作用
- CSS hack IE常见兼容性问题
- Mathtype 常用快捷键