第3章 随机变量的数字特征
来源:互联网 发布:淘宝网店提升信誉 编辑:程序博客网 时间:2024/05/19 17:05
第3章 随机变量的数字特征
[TOC]
随机变量的数字特征,是某些由随机变量的分布所决定的常数,它刻画了随机变量(或者说,刻画了其分布)的某一方面的性质。
3.1 数学期望(均值)与中位数
3.1.1 数学期望的定义
设随机变量X只能取有限个可能值
a1,a2,⋯,am ,其概率分布为P(X=ai)=pi(i=1,⋯,m) 。则X的数学期望,记为E(X)或EX,定义为:
E(X)=a1p1+a2p2+⋯+ampm=∑aipi.
数学期望也常被称为均值。
当X取无穷多个值时,∑aipi 的上界取无穷,这时候要求这个级数是收敛的。这就要求:
∑i=0∞|ai|pi<∞ 对于连续型随机变量的情况,设X是一个连续型随机变量,如果:
∫∞−∞|x|f(x)dx<∞
则X的数学期望为:
E(X)=∫∞−∞xf(x)dx
数学期望是由随机变量的分布完全决定的。
3.1.2 数学期望的性质
若干个随机变量和的期望等于各变量的期望之和,即:
E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn).
若干个独立随机变量之积的期望等于各变量的期望之积,即:
E(X1X2⋯Xn)=E(X1)E(X2)⋯E(Xn).
注意这里要求各个随机变量是相互独立的。
设随机变量X为离散型,有分布函数
P(X=ai)=pi(i=1,2,⋯) ;或者为连续型,有概率密度函数f(x) 。则:
E(g(x))=∑ig(ai)pi(当∑i|g(ai)|pi)<∞时)
或
E(g(X))=∫∞−∞g(x)f(x)dx(当∫∞−∞|g(x)|f(x)dx<∞时)
也就是说,要求g(x)的期望,并不一定非要求出来g(x)的密度函数。
E(cX)=cE(X)
3.1.3 条件数学期望(条件均值)
按定义,条件数学期望:
E(Y|x)=∫∞−∞yf(y|x)dy
它反应了随着x的取值变化,Y的变化情况是如何。这通常是研究者所关心的主要内容。比如人群中固定身高x,平均体重的变化情况。在统计学上,也把E(Y|x)作为x的函数,称为Y对X的“回归函数”。
联想到全概率公式,有:
即一个变量的期望等于其条件期望的期望。
3.1.4 中位数
设连续型随机变量X的分布函数为F(x),则满足条件:
P(X<m)=F(m)=1/2
的m,称为X或分布F的中位数。
与期望相比,中位数受个别特大值或特小值的影响很小。但是,应用却没有期望广泛,主要是因为:
- 期望(均值)有很多优良的性质。
- 中位数本身固有某些缺点,比如可以不唯一。
- 对于离散型的变量,可能并没有理想的“中位”数。
3.2 方差与矩
设X为随机变量,分布为F,则:
Var(X)=E[(X−E(X))2]
称为X或分布F的方差,其平方根Var−−−√ 称为X或分布F的标准差。
Var(X)=E(X2)−[E(X)]2
- 常数的方差为0。
- 若c为常数,则
Var(X+c)=Var(X) 。 - 若c为常数,则
Var(cX)=c2Var(X) 。
独立随机变量之和的方差等于各变量的方差之和。
Var(X1+⋯+Xn)=Var(X1)+⋯+Var(Xn)
设X为一随机变量,
E(X)=a ,而Var(X)=σ2 。记Y=(X−a)/σ ,则E(Y)=0,Var(Y)=1 。这样对X进行一次线性变换后,得到一个具有均值为0、方差为1的变量Y。常称Y是X的“标准化”。
正态分布完全由均值和方差决定。方差
3.2.2 矩
设X为随机变量,c为常数,k为正整数。则量
E[(X−c)k] 称为X关于c点的k阶矩。
比较重要的有两种情况:
c=0,αk=E(Xk) 称为X的k阶原点矩。c=E(X),μk=E[(X−E(X))k] 称为X的k阶原点矩。
3.3 协方差与相关系数
记
称
E[(X−m1)(Y−m2)] 为X,Y的协方差,并记为Cov(X,Y) 。
Cov(c1X+c2,c3Y+c4)=c1c3Cov(X,Y)
Cov(X,Y)=E(X,Y)−m1m2
两条性质:
1.若X,Y独立,则
2.
称
Cov(X,Y)/(σ1σ2) 为X,Y的相关系数,并记为Corr(X,Y) 。
形式上,可以把相关系数看成是“标准尺度下的协方差”。
两条性质:
1.若X,Y独立,则
2.
可以将相关系数看成是X与Y之间线性关系程度的度量。
3.4 大数定理和中心极限定理
3.4.1 大数定理
设
X1,X2,⋯,Xn,⋯ 是独立同分布的随机变量,均值和方差分别为a,σ2 。则对任意给定的ε>0 ,有:
limn→∞P(|X¯−a|≥ε)=0
大数定理也可以理解成是当n很大时,我们有很大的把握断言均值很接近a。
在概率论中,叫做
马尔科夫不等式:
P(Y≥ε)≤E(Y)/ε
契比雪夫不等式:
P(|Y−EY|≥ε)≤Var(Y)/ε2
3.4.2 中心极限定理
也叫作林德伯格定理或林德伯格-莱维定理。
设
X1,X2,⋯,Xn,⋯ 是独立同分布的随机变量(注意并没有说是什么分布),均值和方差分别为a,σ2 。则对任何实数x,有:
,其中limn→∞P(1n√σ(X1+X2+⋯+Xn−na)≤x)=Φ(x) Φ(x) 是标准正态分布N(0,1) 的分布函数。
这其实是一个标准化的过程。这告诉我们,在很难求出
若
棣莫佛-拉普拉斯定理(最早的中心极限定理)
limn→∞P(1np(1−p)−−−−−−−−√σ(X1+X2+⋯+Xn−np)≤x)=Φ(x)
如果
其中
可以修正为:
- 第3章 随机变量的数字特征
- 第4章 随机变量的数字特征
- 第四章 随机变量的数字特征
- 第三章 随机变量的数字特征
- 概率论第四章-随机变量的数字特征
- Matlab--随机变量的数字特征
- 第四章 随机变量的数字特征之协方差与相关系数
- 概率统计:第四章 随机变量的数字特征
- 概率论——随机变量的数字特征
- 概率论与数理统计学习笔记三:随机变量的数字特征
- 随机变量的数字特征(概率论常用知识)
- Matlab与随机变量和样本的数字特征
- 第3章 多维随机变量及其分布
- 第3章: 随机变量,密度函数,一元线性回归模型
- 数学篇----随机变量的数值特征[概率论](一)
- 第2章 随机变量及概率分布
- 第2章 随机变量及其分布
- 机器学习之概率论与数理统计基础知识-(2)随机变量和数字特征
- 计算机网络相关知识
- 初识BottomBar
- 关于解决cv2.findContours返回值too many values to unpack (expected 2)的问题
- JSON数据格式以及GSON的使用
- 反射
- 第3章 随机变量的数字特征
- Wolf and Rabbit
- 转发和重定向的区别
- Java 接口的继承
- Python中的编程思想(1)
- Spring boot restful api demo
- php ajax上传图片的方法
- 图片错误Execution failed for task
- MVC过滤器