Excel在统计分析中的应用—第一章—统计基础与数据描述

来源:互联网 发布:推荐书籍知乎 编辑:程序博客网 时间:2024/04/30 20:01

没有系统学习过统计学,看到《Excel在统计分析中的应用》这本书,感觉值得一读。

从今天开始,快速学习一下这本书。


1. 总体和样本

总体:对一组数据中的每一个元素进行观察

样本:只对一部分元素进行观察

归纳统计学/统计推断:如果样本可以很好地反映总体的特性,可通过样本的分析对总体下结论

描述性统计/演绎统计学:仅描述和分析特定对象而不下结论、不推断

2. 数据类型

连续数据:可取区间内的任何值(受精度限制)

离散数据:仅可取区间内的有限个值

横截面数据:特定时间内一组变量的状况

时间序列数据:某特定变量随时间变化情况

组数据:数据太多时,无法直观地观察其中的规律,有必要进行加工汇总,将其转换为组数据(方法1:使用countif函数,方法2:使用frequency函数)

非组数据:未分组数据


关于如何使用frequency函数分组数据,可参考:

数据分析(入门篇)-第二章-玩转数据分析-Part2(Excel数据分析工具库-描述性统计分析)


名称

公式

结果

最大值

=MAX(visits)

3279

最小值

=MIN(visits)

49

极差

=H4-H5

3230

分组数

=CEILING(SQRT(COUNT(visits)),1)

12

分组组距

=H6/H7

269.16667

这几个公式比较重要,特别是极差、分组数、分组组距

提示:countif的灵活性高于frequency


3. 数据描述

频率分布图:以等级区间(指数值)作为横轴,以观测值频率作为纵轴

相对频率分布图:观测值数目与纵观测量的比值作为纵轴(与频率分布图形状相似)

累积频率分布图或累积曲线:使用累积频率绘制(由countif函数绘制)

直方图:使用Excel分析工具库中的“直方图”进行分析

阅读全文
0 0