熵的理解笔记(只有我看的懂哈哈哈- -)
来源:互联网 发布:搜番软件 编辑:程序博客网 时间:2024/06/05 10:34
笔记来自博客:http://www.ruanyifeng.com/blog/2017/04/entropy.html阮一峰老师博客文章《熵:宇宙的终极规则》 以及 吴军老师的书《数学之美》第二版
物理学中的熵:
物理学家发现,能量无法百分百地转换。比如,蒸汽机使用的是热能,将其转换为推动机器的机械能。这个过程中,总是有一些热能损耗掉,无法完全转变为机械能。
一开始,物理学家以为是技术水平不高导致的,但后来发现,技术再进步,也无法将能量损耗降到零。他们就将那些在能量转换过程中浪费掉的、无法再利用的能量称为熵。后来,这个概念被总结成了"热力学第二定律":能量转换总是会产生熵,如果是封闭系统,所有能量最终都会变成熵。
能量转换会让系统的混乱度增加,熵就是系统的混乱度。
转换的能量越大,创造出来的新状态就会越多,因此高能量系统不如低能量系统稳定,因为前者的熵较大。而且,凡是运动的系统都会有能量转换,热力学第二定律就是在说,所有封闭系统最终都会趋向混乱度最大的状态,除非外部注入能量。
物理学告诉我们,没有办法消除熵和混乱,我们只是让某些局部变得更有秩序,把混乱转移到另一些领域。
信息学中的熵:
一条信息的信息量与其不确定性有着直接的关系。比如说:要弄懂一件非常不确定的或者是一无所知的事,就需要了解大量信息。如果已经对某件事了解较多,则不需要太多的信息就能将其搞清楚。信息量就等于不确定性的多少,而信息量的量化度量就是信息学中的熵。
一个事物内部会有随机性(不确定性),假定为U,从外部消除这个不确定性惟一的方法就是引入信息I,而需要引入的信息量取决于这个不确定的大小,即I>U 才行。当I<U时,
U’ = U – I
这些信息可以消除一部分不确定性,然后产生了新的不确定性U’。(就类似物理学理解把混乱转移到另一些领域)。反之,如果没有信息,任何公式或者数字游戏都无法排除不确定性。
条件熵‘
通过获取“相关的”信息能够消除不确定性,这就又引入了条件熵的概念。
假定X和Y是两个 随机变量,X是我们需要了解的。假定我们现在知道了X的随机分布P(X),那么也知道了X的熵:
X的原始不确定性就是这么打。现在假定我们还知道Y的一些情况,包括它和X一起出现的概率,在数学上称为联合概率分布,以及在Y取不同值的前提下X的概率分布,在数学上称为条件概率。定义在Y的条件下的条件熵为:
H(X) >= H(X|Y) ,多了Y的信息后,关于X的不确定性下降了。
互信息
而互信息就是衡量H(X) 与 H(X|Y) 之间差异的量化度量,也是衡量X与Y两个事件的相关性的量化度量,就是在了解其中一个Y的前提下,对消除另一个不确定性所提供的信息量
I(X;Y) = H(X) - H(X|Y)
互信息是一个取值之间的函数,当X和Y完全相关时(就是在知道Y的条件下可以消除了X的所有不确定性,H(X|Y)=0),它的取值就是H(X),同时
H(X)= H(Y);反之二者完全无关时(就是在知道Y的条件下对X的不确定性没有任何消除作用,H(X|Y)= H(X)),它的取值是0.
- 熵的理解笔记(只有我看的懂哈哈哈- -)
- 我的https的深度理解---哈哈哈
- 哈哈哈我的新车
- 我的第一个笔记,哈哈哈,小学就没写过
- 这次是分页,看在我终于会的面子上,算是原创吧,哈哈哈
- 哈哈哈,我有新的帐号了
- 我的第一个c++程序哈哈哈
- 我的博客开始啦---哈哈哈
- 转载的只有我要看,你最好别看
- 只有程序员看的懂面试圣经
- 我的痛,只有我自己懂
- 我看JSQMessageViewController的笔记
- 我理解的现在网站结构,只有一张图
- 2013年上半年工作总结,哇哈哈哈,给自己看的。
- 我要开始我的大学之途了哈哈哈
- 我就是想发一下我的小站 哈哈哈
- io 哈哈哈估计只有我自己能看懂
- 将来如果我学过一门便会删掉里面相关的文章(立个小目标嘛哈哈哈)
- “用户登陆”之MD5加密
- gulp构建工具
- 结构体的定义、输出 和结构体指针的使用。
- 基于javascript实现图片懒加载
- 递归实际例子解析
- 熵的理解笔记(只有我看的懂哈哈哈- -)
- UML视频感想
- PSR-2 (Coding Style Guide) 编码风格向导
- 2017年前端开发工具趋势
- POI解析Excel封装工具
- Firebase 部署篇
- 互信息
- 机房重构准备工作(2)--sql注入和参数化查询
- 面向对象编写照片墙组件