生活中的数学(为生活建模)

来源:互联网 发布:中国森林覆盖率 知乎 编辑:程序博客网 时间:2024/04/30 09:12

生活中的数学(为生活建模)
生活中的数学(为生活建模)(二)
生活中的数学(为生活建模)(三)

分布,各种分布

0-1均匀分布

0-1伯努利实验,还记得吧,简单吧,比如投一枚硬币,正面向上记为0,反面向上记为1,fifty—fifty,这是一种特例啦。考虑掷骰子,点数为2的概率,也是伯努利实验,2与非2,对吗。所以,所以什么?伯努利实验不仅能够仿真简单的只有2种结果的硬币,也能仿真具有6个结果的骰子,归根结底它仿真的是非此即彼这一现象,还记得对立事件(本事件的概率不好求,而其对立事件的概率好求时,就转化为其对立事件的求解,再被1减)这一概念吧,也即事件与其对立事件构成全部样本空间 P(A)+P(Ac)=1,而事件与对立事件恰恰构成伯努利实验。

还记得二项分布的别名叫什么吗,N重伯努利实验,即将伯努利实验重复N次。二项分布似乎也很简单。考虑这样一种情况,掷骰子10次,2出现两次的概率,心算好算吗,并不好算。它其实服从二项分布(n=10, p=1/6),2与非2,10次,随机变量X定义为二出现的次数。

P(X=k|n,p)=(nk)pk(1p)nkP(X=2|10,16)=(102)162568

二项分布及多项分布

五个数,其中两个比5小,3个比五大;
显然是一个二项分布问题((52)p2(1p)52);

二项分布又名 n重伯努利分布;

一个骰子(均匀六面体标有1-6,标定值域),抛10次(产生10个数),2出现3次的概率是:自然是二项分布(2与非2,抛10次,10重伯努利试验),记随机变量 X 为2出现的次数,2出现(伯努利试验)的概率为16,为我们的p,2不出现的概率为56,则

p(X=2)=Binom(X=k|n,p)=(nk)pk(1p)nk=(102)162568

那我再问,如果最终出现了(1个1,1个2,1个6,2个3,2个4,3个5)(没有顺序),则其发生的概率为?此时对应于,多项分布。
p(n⃗ )=Mult(n⃗ |N,p⃗ )p((1,1,2,2,3,1))=(10(1,1,2,2,3,1))161161162162163161

那我接着问,如果最终出现的结果为(6个奇数,1个2,2个4,1个6),则其出现的概率为?
p(n⃗ )=Mult(n⃗ |N,p⃗ )p((6,1,2,1))=(10(6,1,2,1))126161162161

我们将掷骰子问题推广到文本建模上来,此时的骰子便不只是6面,假设为 V面体,不均匀。抛 N次,产生 N个词,假如我们关注每个词vi的发生次数为 ni,那么 n⃗ =(n1,n2,,nV)正好是一个多项分布:

p(n⃗ )=Mult(n⃗ |N,p⃗ )=(Nn⃗ )k=1Vpnkk

rating distribution

IMDB 网站上为为2500个剧的打分分布:



样本空间

样本空间(sample space),及其中情况(cases)的概率分布,比如掷骰子的点数,构成的样本空间为 {1,2,3,4,5,6},概率分布为 {16,16,16,16,16,16}

联系生活的时候到了,我将之命名为为错误建库。我们说一个有经验的程序员,几乎能在很短的时间内,甚至在第一时间,根据提示,根据问题,锁定bug,解决问题。一个有经验的大夫,也能根据病人的症状,找出病灶,开出药方。

对一个有经验的程序员,一个有经验的大夫而言,有经验指的是什么?指的就是构建了错误,bug,病状的样本空间,这还不够,还差对它们的可能性的评估,也即概率分布,哪种原因更有可能。

组合数(combination)

抛硬币抛两次,两次均为正,两次均为反的情况数均为1,而有正有反的情况数为2。

围棋与三进制

如果把抛硬币多次(或者同时抛多枚硬币,本质是一样的,因为彼此独立)的正(1)反(0),组合在一起就构成的二进制,则骰子如果标识为0-5,则得到了6进制,同理围棋中的每一个位置(19*19=361个位置),无黑白,三种状态自然构成3进制,也即进制与其样本空间的状态数有关(#S)。


这里写图片描述


这里写图片描述

0 0
原创粉丝点击