第二章 数据的收集
来源:互联网 发布:数到五答应我 网络歌手 编辑:程序博客网 时间:2024/05/16 19:38
1 数据的来源
数据的间接来源:二手资料
数据的直接来源
2 调查数据
数据采样阶段:如何抽选出一个好的样本
使用抽样的方式采集数据的具体方式有很多种,可以分为两类:概率抽样和非概率抽样
概率抽样:也称随机抽样。主要包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样
分层抽样:将抽样样本按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来对总体的目标量进行估计。
整群抽样:将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对选中群的所有单位实施调查。
系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。
多阶段抽样:类似整群抽样,但并不是调查群内的所有单位,而是再进一步抽样。
非概率抽样:抽样样本时并不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。主要有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样
配额抽样:类似于分层抽样,首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。例如样本按年龄计数,再抽样。
两类比较:概率抽样适合使用样本的结果对总体相应的参数进行推断,而非概率抽样不适合。
搜集数据基本方法:自填式、面访式、电话式、观察式等
数据搜集方法的选择:需考虑抽样框的有关信息、目标总体的特征、调查问题的内容、有形辅助物的使用、实施调查的资源、管理与控制、质量要求
3 实验数据
搜集数据的另一类方法:实验
实验组:每个单位接受某种特别的处理
对照组:不接受特别处理
4 数据的误差
主要有两类:抽样误差和非抽样误差。
抽样误差:由于抽样的随机性引起的样本结果与总体真值之间的误差。与样本量的大小,
非抽样误差:除抽样误差之外,由于其他原因引起的样本观察结果与总体真值的差异。包括抽样框误差、回答误差、无回答误差、调查员误差、测量误差等。
误差控制
- 第二章 数据的收集
- 不错的数据收集
- 第二章 数据的存储与检索
- 《垃圾收集》笔记——第二章
- 《垃圾收集》笔记——第二章
- 关于大数据的收集
- 收集数据的再次尝试
- 第二章 数据契约
- 第二章 数据准备
- 第二章 查看数据
- 第二章 认识数据
- 第二章 认识数据
- 第二章 数据访问
- 第二章:处理数据
- 第二章 检索数据
- 数据挖掘的数据集资源收集
- 数据收集
- 数据收集
- wampserver2.5下安装memcache扩展的问题
- 香蕉派中查看CPU温度
- 试试K64的CAN功能
- 第一个原创文章
- Effective C++——条款6(第2章)
- 第二章 数据的收集
- MySQL控制(关闭、打开)自动提交功能
- 生成二维码的jquery插件
- python学习--核心编程5习题以及知识点记录
- word-wrap、white-space和word break的区别
- RESTful Java client with RESTEasy client framework
- HDU 1950 最长上升子序列
- 工程师薪酬分析:Java 不是过去式
- 文章标题