离散分布——二项分布、多项分布、超几何分布
来源:互联网 发布:centos iso镜像下载 编辑:程序博客网 时间:2024/04/30 18:12
二项分布
伯努利实验
介绍二项分布前,先了解一下伯努利实验。
比如一个鸡蛋是否能成功孵出小鸡,扔硬币,进入商店的人是否购买了东西,一个正在生产的产妇是生男生女,这些都是伯努利实验。它满足以下条件:1、每次只可能有两种结果;2、两次实验之间互不影响。
和伯努利实验最常见的问题就是:如果进行n次伯努利实验,每次成功概率为p,那么成功k次的概率是多少?这个概率分布就是二项分布。
R语言应用
已知某批鸡蛋的孵出率prob为0.9,抽取5个鸡蛋检查其孵化情况,这5个鸡蛋孵出1、2、3、4、5、6个小鸡的概率分别是多少?
dbinom(1,5,0.9)//0.00045dbinom(2,5,0.9)//0.0081dbinom(3,5,0.9)//0.0729dbinom(4,5,0.9)//0.32805dbinom(5,5,0.9)//0.59049
电视台的某个节目,官方预估收视率为25%,当我们电话访问了1500人之后,发现收看率只有23%。官方预估的数据准确吗?
//进行二项分布检验binom.test(1500*0.23,1500,0.25,alternative = "less")//输出p值为0.03837,小于0.05,可以确认假设成立,官方数据有水分。//换一种方式,计算1500个样本中出现23%收视率的概率,概率太小就可以此否定官方的数据。pbinom(1500*0.23,1500,0.25)//出现这种情况的概率是0.03836649,这么小概率的事件被我们碰到了,明显不可能,那就是官方的数据有水分了。
参考文档
R语言系列:常见离散分布及相关函数
多项分布
上面提到的伯努利实验每次结果有两种可能性,如果实验结果有多种可能性,实验结果就满足多项分布。这里举一些应用例子
1、某种化妆品在市场上共有4个品牌,我们从以往的销售数据可以知道它们的市场占有率分别为:10%,20%,50%,20%。可以近似认为消费者只买自己最喜欢的品牌。在商场中随机挑选10个消费者做调研,让每个人从这4个品牌中选一个自己最喜欢的品牌。那么选取各品牌的人数分别为1,2,4,3的概率有多大?
说明:10次实验,每次4个选项,概率分别为:0.1,0.2,0.5,0.2。
2、掷骰子时,一次掷出豹子的概率有多大?
只要3个点数相同,就是豹子,一共有6种豹子,且每种出现概率相同。每种骰子掷出6个点的概率相同。
说明:一次掷骰子相当于3次实验,每次实验有6种结果,概率都是1/6。
R应用
//品牌选择的概率计算dmultinom(c(1,2,4,3),prob=c(0.1,0.2,0.5,0.2));//0.0252//掷骰子掷出豹子的概率计算p1=dmultinom(c(3,0,0,0,0,0),prob = c(1/6,1/6,1/6,1/6,1/6,1/6));p2=dmultinom(c(0,3,0,0,0,0),prob = c(1/6,1/6,1/6,1/6,1/6,1/6));p3=dmultinom(c(0,0,3,0,0,0),prob = c(1/6,1/6,1/6,1/6,1/6,1/6));p4=dmultinom(c(0,0,0,3,0,0),prob = c(1/6,1/6,1/6,1/6,1/6,1/6));p5=dmultinom(c(0,0,0,0,3,0),prob = c(1/6,1/6,1/6,1/6,1/6,1/6));p6=dmultinom(c(0,0,0,0,0,3),prob = c(1/6,1/6,1/6,1/6,1/6,1/6));//p1=p2=p3=p4=p5=p6=0.00462963p=0.00462963*6
超几何分布
二项分布中,每次实验互相独立。如果互相有影响,那就会出现超几何分布。
假设有一批500件的产品,次品有5个,即次品率1%,质检人员随机抽取20个进行检查。
如果采取放回抽取,那就是做20次伯努利实验,每次实验的成功概率为1%,抽取到不合格产品的概率满足二项分布。如果采取不放回抽取,抽取到不合格产品的概率就满足超几何分布。
//放回抽取,抽取到1,2,3,4,5件次品的概率dbinom(c(1,2,3,4,5),20,0.01)//输出结果为:1.652337e-01 1.585576e-02 9.609552e-04 4.125313e-05 1.333434e-06//不放回抽取,抽取到1,2,3,4,5件次品的概率dhyper(c(1,2,3,4,5),5,500,20)//输出结果为:1.697266e-01 1.338094e-02 4.986684e-04 8.757606e-06 5.778215e-08
假设我们把样子和总体的差距无限放大,是否放回对抽取结果的影响越来越小,两种情况下的概率会趋于接近
dhyper(c(1,2,3,4,5),5,500000000,20)//2.000000e-07 1.520000e-14 5.471999e-22 9.302399e-30 5.953536e-38dbinom(c(1,2,3,4,5),20,0.00000001)//2.000000e-07 1.900000e-14 1.140000e-21 4.844999e-29 1.550400e-36
- 离散分布——二项分布、多项分布、超几何分布
- 概率分布-二项分布、多项分布
- 二项分布与多项分布
- 二项分布和多项分布
- 二项分布和多项分布
- 伯努利分布、二项分布、几何分布、超几何分布、泊松分布
- 伯努利分布、二项分布、几何分布、超几何分布、泊松分布
- 伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布
- 伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布
- 概率分布之二项分布与多项分布
- 理解二项分布,beta分布,多项分布 狄利克雷分布的
- Excel在统计分析中的应用—第六章—概率分布及概率分布图-Part4-离散型概率分布(超几何分布函数HYPGEOM.DIST()的应用)
- 几何分布和超几何分布
- 【联系】—— Beta 分布与二项分布、共轭分布
- 多项分布
- 多项分布
- 005 二项分布、泊松分布、几何分布、指数分布、正态分布
- 006 二项分布、泊松分布、几何分布、指数分布、正态分布习题
- 机器学习算法-随机森林
- JDBC详解
- hdu 5120 Intersection 两环面积交
- 使用Condition控制线程通信:
- 在Eclipse中使用JUnit4进行单元测试(中级篇)
- 离散分布——二项分布、多项分布、超几何分布
- Think in AngularJS:对比jQuery和AngularJS的不同思维模式
- Eclipse Java EE工程报错:JAX-RS (REST Web Services) 2.0 can not be installed、JAX-RS (REST Web Services) 2
- ubuntu中aptitude工具的意思
- angularjs学习
- 本机更新到PHP7.0.10后不能用PHP_OCI8_12C.dll
- NodeJS学习笔记(一)——搭建开发框架Express,实现Web网站登录验证
- 【nysql】1045-Acess denied for user:'root'@'localhost'(Using password:YES)错误处理
- Linux 64位系统下 inet_ntoa 报段错误问题