最大熵
来源:互联网 发布:视频混合软件 编辑:程序博客网 时间:2024/05/19 12:25
最大熵
最大熵方法通常描述为:从所有符合已知知识的分布中选择信息熵最大的分布
主要内容:
- boltzmann distribution
- maxmium entropy principle
- constraint rule
- approximate
boltzmann distribution
物理学家玻尔兹曼使用过一个例子:
掷
要选择一种最可能的比例,可以计算某种比例
在约束条件
利用斯特林公式,
在总和一定的情况下,某个骰子出现不同点数的概率也是不同的。所有骰子可能的投掷方式越多,可能性越大。它的边缘分布服从boltzmann分布。
maxmium entropy principle
Jaynes改变了原始含义,希望根据”least biased”推测概率分布。
定义变量
在这些信息的基础上,如何求出某个函数
在较少的信息下确定概率是一个古老的问题。Laplace的”Principle of Insufficient Reason”给出了一个选择标准:两个事件在没有其他信息的情况下应该分配相等的概率。然而,除了满足对称性外,这个标准看起来没什么依据。
我们的问题是找到概率分布,它需要满足已知的信息,并且满足无偏原则。信息论提供了衡量不确定性的标准,我们可以在满足已知信息的条件下,让信息熵最大化,对未知信息做最少的假设。
在分布符合指数分布族时,极大似然估计的样本均值满足期望,这时最大熵分布和极大似然估计得到的结果一致。
如果在已知一些函数
在
求似然函数极大值,让导数为0得到等式:
constraint rule
最大熵原则的约束条件是有争议的,为什么让
如果把
看一个掷骰子的例子。假设掷了
通过最大熵,显然骰子是均匀的,
但是通过贝叶斯方法,结果却不同,并且随着
假设先验分布是均匀分布
然后是似然函数
得到后验概率
当
这个式子不太容易看出来分布规律,可以列一张表
可以看到,随着
approximate
最大熵常常作为一种近似方法。
若
为在
对其求微分,可以计算出最接近于
其中
若
参考的资料
- http://bactra.org/notebooks/max-ent.html
- 信息论基础
- Jaynes Information Theory And Statistical Mechanics I
- The Constraint Rule of the Maximum Entropy Principle
- 最大熵
- 最大熵
- 最大熵
- 最大熵模型:读书笔记
- 最大熵推导
- 最大信息熵原理
- 最大熵模型
- 最大熵模型:读书笔记
- 最大熵模型
- 最大熵模型
- 最大熵模型
- 最大熵模型:读书笔记
- 最大熵模型
- 最大熵模型
- 最大熵模型
- 最大熵算法笔记
- 最大熵原理
- 最大熵模型
- rocketmq学习笔记 五 源码之rocketmq-store
- 面向对象的五大基本原则
- java 中 native 关键字用法
- rocketmq学习笔记 五 源码之rocketmq-broker
- 二进制中1的个数
- 最大熵
- css图片切割
- java反射机制
- 正则表达式
- 查看jdk Sun /Open Jdk 源码包说明
- 安卓内容提供者
- ubuntu下使用Vim学习C++
- 锋利的jquery初体验--第二章 品牌列表效果
- 1001. 害死人不偿命的(3n+1)猜想 (15)