统计学汇总备忘

来源：互联网发布：java雷霆战机图片素材编辑：程序博客网时间：2024/06/03 23:00

随机变量的数学期望

在概率论

和统计学中，一个离散性随机变量的期望值（或数学期望、或均值，亦简称期望）是试验中每次可能结果的概率乘以其结果的总和。换句话说，期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是，期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。（换句话说，期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。）

大数定律

大数定律（Law of Large Numbers），指在随机试验中，每次出现的结果不同，但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。典型的例子就是抛硬币的伯努利试验，当抛硬币的次数足够多的时候，正反面出现的概率都接近于1/2。

中心极限定理

是概率论中的一组定理。中心极限定理说明，大量相互独立的随机变量，其均值的分布以正态分布为极限。
设从均值为μ、方差为σ^2;（有限）的任意一个总体中抽取样本量为n的样本，当n充分大时，样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布。

变异系数

变异系数是级差、标准差和方差一样都是反映数据离散程度的绝对值，其数据大小不仅受变量值离散程度的影响，而且还受变量值平均水平大小的影响。一般来说，变量值平均水平高，其离散程度的测度值也大，反之越小。如果单位和（或）平均数不同时，比较其变异程度就不能采用标准差，而需采用标准差与平均数的比值（相对值）来比较。标准差与平均数的比值称为变异系数，记为C·V。变异系数可以消除单位和（或）平均数不同对两个或多个资料变异程度比较的影响。

散点图解读：
散点图用于描述成对数据或者两个因素之间的相关关系的图示。

全距（极差）
样本最大值与最小值的差
正态总体

取值的概率
　　　　　　

　　在区间(μ-σ，μ+σ)、(μ-2σ，μ+2σ)、(μ-3σ，μ+3σ)内取值的概率分别为68.3%、95.4%、99.7%。

也就是说，全距近似等于6倍标准差，可用全距/6 来粗略估计标准差。