大嘴巴漫谈笔记-抽样分布与假设检验

来源:互联网 发布:sql大文件导入数据库 编辑:程序博客网 时间:2024/04/30 12:13

大嘴巴漫谈笔记-抽样分布与假设检验


总体分布:所有元素出现概率的分布.

样本分布:选择的样本在随机变量上的对应的频次分布,

抽样分布:样本的函数分布,是样本统计量的概率分布【统计量是样本的函数,如:均值、求和、方差】

 

总体思想:借助样本估计总体

如何借助样本数据估计总体未知参数?答:参数估计

 

参数估计常用两种方法:

样本数据值叫观测值

总体数据值叫理论论

大原则:使样本观测值与总体理论值偏差非常小。

数学原理:求极值的问题。

数学解决方法:1.求偏差(偏差平方和) 2.求极值:通过求导、求偏导、微积分

第一种方法叫最小二乘法——偏差平方和最小。

 

eg.

总体值f(X)=a+bX,总体参数:a,b

预测值yi

 

第二种方法叫极大似然法——事件发生概率最大。

极大似然——看上去最可能发生

事件的概率——所有样本出现的概率【所有样本同时出现:对于离散型是概率的乘积;对于连续型是概率密度的乘积】

数学原理:求最值的问题,参数是

数学技巧:取对数,变成求和

 

说服力更强的参数估计方法:

区间估计——总体未知参数(随机变量)落在区间内的概率

正态分布函数可能未知的总体参数:,

比方说对的区间估计

通过样本均值,来估计总体均值,需要构造样本均值的统计量。引入标准正态分布,利用其图像关于y轴的对称性。

【这也是一个z-score标准化(zero-mean normalization)标准差标准化的过程,经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:】

 

假设检验

根据样本数据判断我们对总体的某种趋势推测是否正确(比方说统计量>80)

思路:1. 假设总体,检验样本,来判断总体的假设是否成立。2. 检验样本中是否会出现小概率事件。

如何构造出小概率事件:当原假设为真又拒绝了原假设(样本均值和指定值差距比较大时就拒绝)

0 0
原创粉丝点击