第二章 数据的收集

来源:互联网 发布:数到五答应我 网络歌手 编辑:程序博客网 时间:2024/05/16 19:38

1 数据的来源

数据的间接来源:二手资料
数据的直接来源

2 调查数据

数据采样阶段:如何抽选出一个好的样本
使用抽样的方式采集数据的具体方式有很多种,可以分为两类:概率抽样和非概率抽样
概率抽样:也称随机抽样。主要包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样
分层抽样:将抽样样本按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来对总体的目标量进行估计。
整群抽样:将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对选中群的所有单位实施调查。
系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。
多阶段抽样:类似整群抽样,但并不是调查群内的所有单位,而是再进一步抽样。
非概率抽样:抽样样本时并不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。主要有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样
配额抽样:类似于分层抽样,首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。例如样本按年龄计数,再抽样。
两类比较:概率抽样适合使用样本的结果对总体相应的参数进行推断,而非概率抽样不适合。
搜集数据基本方法:自填式、面访式、电话式、观察式等
数据搜集方法的选择:需考虑抽样框的有关信息、目标总体的特征、调查问题的内容、有形辅助物的使用、实施调查的资源、管理与控制、质量要求

3 实验数据

搜集数据的另一类方法:实验
实验组:每个单位接受某种特别的处理
对照组:不接受特别处理

4 数据的误差

主要有两类:抽样误差和非抽样误差。
抽样误差:由于抽样的随机性引起的样本结果与总体真值之间的误差。与样本量的大小,
非抽样误差:除抽样误差之外,由于其他原因引起的样本观察结果与总体真值的差异。包括抽样框误差、回答误差、无回答误差、调查员误差、测量误差等。
误差控制

0 0
原创粉丝点击