统计学中的基本概念

来源:互联网 发布:医学数据分析重要吗? 编辑:程序博客网 时间:2024/06/04 19:11

《商务与经济统计学 》读书笔记


一. 统计学思维

1. 统计学几个基本概念

  • 描述统计 和 推断统计(统计的两大应用)
描述统计(descriptive statistics):利用数字或者图标的方法,寻找数据的规律,总结其中的信息,以恰当的方式展示这些信息。
推断统计(inferential statisticss):利用样本数据信息,对总体情况估计、推断、预测或者归纳。
  • 定量数据 和 定型数据(数据的两种类型)
定量数据(quantitative data):可以用数值记录的数据。
定性数据(qualitative data):不能用数值记录的数据。
  • 数据收集的方法
1. 公开发表的资料(published source),如国研网、图书杂志等。
2. 实验设计(designed experiment),会对实验对象进行某些变量的控制,比如医疗实验、物理化学实验数据。
3. 观察性研究(observational study),不会对实验个体进行任何控制,最常用的方法是调查(survey)
  • 抽样方法
1.简单随机抽样(simple random sampling):从总体中随机抽取样本,每个样本被抽到的概率相同。
2.分层随机抽样(stratified random sampling):将总体单元分层不同的层,每层抽取一定数量单元组成样本。
3. 整群抽样(cluster sampling):以自然群作为抽样的单位,比如要抽取学生进行访谈,先抽取一定数量的学校,然后对抽样的学校在抽样学生。
4. 系统抽样(systematic sampling):对所有试验单元没隔K个抽取一个试验单元。
5.  随即响应抽样(randomized response sampling):对于一些敏感话题可以使用,比如问学生是否有过逃课记录,有逃课记录的同学可能不愿意回答是,因此可以准备两个问题,中午是否吃的铁板饭?,没人会随机问一个问题,调查人员也不知道是哪个问题,后期通过统计学方法来实现统计逃课记录的同学。
  • 非随机样本出现的问题
1.选择偏差(selection bias):某部分样本无法被抽样到导致的偏差
2. 无应答偏差(nonresponse bias):被选中的样本中,不能代表所有的个体。
3. 测量误差(measurement error):测量的数据不精确
1 0
原创粉丝点击