做统计分析课程设计时回忆的一些知识
来源:互联网 发布:重装系统后连不上网络 编辑:程序博客网 时间:2024/05/20 11:21
真的全忘了。。。
泊松、指数、伽马分布
- 泊松分布: 已知某事件单位时间的平均发生率
λ ,能给出单位时间内实际上发生X次的概率。可以证明二项分布取极限(试无数次)就是泊松分布。 - 指数分布: 泊松过程中,第k次随机事件与第k+1次随机事件出现的时间间隔t服从指数分布,即
t∼Expotional(λ) 。可以发现指数分布的累积分布函数(注意不是概率密度函数):1−e−λt 中的e−λt 就是泊松分布中x个时间内不发生事件的概率。 - 伽马分布:
X∼Γ(α,β) 说的是事件平均概率1β 的时候等到第α 个事件发生的时间X符合伽马分布
以上就是它们之间的关系。提这个是因为指数分布、卡方分布都是伽马分布的特例。
显著性检验
Z检验
有一个来自正态分布总体的样本
t检验
单样本的
有一个来自正态分布总体的样本
因为是用样本估计了总体的标准差,所以不能用正态分布了。学生分布当时被发明出来就是为了解决这个问题的,它的概率密度函数
双样本的、配对的等等
统计量算的方式有差别。
Minitab帮助
维基
F检验
又叫联合假设检验、方差齐性检验。t检验要求两个总体方差相等的时候就要先检验方差齐性。
有两个正态样本,想检验两个总体的方差是否有显著差异。构造统计量
卡方分布
符合标准正态分布的随机变量的平方和服从自由度为 k 的卡方分布。比如有一个来自正态分布总体的样本
线性回归中的显著性检验
检验一个回归系数
用t检验,零假设为回归系数
检验所有的回归系数
用f检验,零假设为所有的回归系数都是0。为了验证这一点,使用了三个平方和(间接表现出零假设的影响):
- SSM/SSR (Sum of Squares for Model/Regression)
- SSE (Sum of Squares for Error)
- SST (Sum of Squares Total)
关系:SST(样本值和样本平均值之差的平方和)=SSM(预测值和平均值之差的平方和)+ SSE(预测值和样本值之差的平方和)。顺便一提,判定系数
把SSM和SSE都除以
最终得到统计量
ANOVA
主要的零假设就是几个样本的均值相等,即没有显著性差异。为了验证这一点,用的基本就是上面显著性检验的方法。
在检验两组之间的差异的时候,就可以用t检验;而在多组的时候,虽然可以两两做t检验,但是不能替代原有的假设,所以用F检验。F检验时也是用组间之差的平方和比上组内之差的平方和。跟回归系数检验里面的F检验一个道理。
总之就是没有特别的方法,就是上面方法的综合运用。
- 做统计分析课程设计时回忆的一些知识
- 系统架构设计时的一些指导思想
- 做毕业设计时遇到的问题变色函数
- 系统构架设计时应考虑的一些必要性因素
- 系统构架设计时应考虑的一些必要性因素
- 系统构架设计时应考虑的一些必要性因素
- Qt设计时的一些技巧 (转)
- 某个课程设计时用到的SQL脚本,贴在这里供自己以后参考一下
- 组件的设计时属性
- 产品设计时的经验教训
- 设计细节不能丢 做页面设计时要注意的细节
- 用 C# 做组件设计时的事件实现方法讨论
- 做程序架构设计时须着重考虑的几点
- 做程序架构设计时须着重考虑的几点
- 在做IC设计时,由于代码风格不好,导致了timing—loop的产生
- 同事整理的对于系统架构设计时的一些指导思想
- 回忆数据库的知识
- 添加简单的设计时支持
- Nim游戏
- LeetCode 200. Number of Islands (并查集)
- 探索Android调用系统的分享功能
- Java集合框架之set
- leetcode第九周解题总结(Bit Manipulation位运算)
- 做统计分析课程设计时回忆的一些知识
- CDH 5.10.0 on CentOS6.9 离线安装
- Stream API
- "=="、equals和hashCode有什么区别
- 黑色星期五
- 1171 保留整数 sdut
- 功能错误小结
- 震惊!微信公众号的真相!
- 关于ComponentName的使用