统计学 导论-数据的搜集-图表展示

来源:互联网 发布:java搭建视频服务器 编辑:程序博客网 时间:2024/05/03 22:01

第一章 导论

1.1 统计数据的类型

  1. 分类数据 性别 企业属性
  2. 顺序数据 比如产品分为一等品 二等品 三等品 次等品等
  3. 数值型数据 按数字尺度测量的观测值

现实中所处理的大多数都是数值型数据

1.2 总体&样本

总体:是包含所研究的全部个体(数据)的集合。
样本:是从总体中抽取的一部分元素,构成样本的元素的数据成为样本量。抽样的目的是根据样本提供的信息推断总体的特征。

第二章 数据的搜集

2.1 数据的来源

间接来源:数据是由别人通过调查或实验的方式搜集的,使用者只是找到他们并加以使用。
直接来源:通过自己调查或实验活动,直接获得的第一手数据。

2.2 调查数据

2.2.1 概率抽样和非概率抽样

按照使用抽样采集数据的方式分为两大类:概率抽样和非概率抽样

  1. 概率抽样 也叫随机抽样
    • 简单随机抽样 (simple random sampling)
    • 分层抽样 (stratified sampling)
    • 整群抽样 (cluster sampling)
    • 系统抽样 (systematic sampling)
    • 多阶段抽样 (multi-stage sampling)
  2. 非概率抽样
    • 方便抽样
    • 判断抽样
    • 自愿样本
    • 滚雪球抽样
    • 配额抽样

第三章 数据的图表展示

3.1 数据的预处理

3.2 品质数据的整理与展示

3.2.1 分类数据的整理与图示

  1. 频数与频率分布
    • 频数 :是落在某一特定类别或组中的数据个数
    • 频率分布: 把各个类别及其落在其中的相应频数全部列出,并用表格的形式表现出来
    • 比例:也叫构成比,它是一个样本(或总体)中各个部分的数据与全部数据之比
    • 百分比:将比例乘以100,用%表示
    • 比率:是样本(或总体)中不同类别数据之间的比值
  2. 分类数据的图示
    • 条形图(横置或纵置)
    • 帕累托图
    • 饼图
    • 环形图

3.2.2顺序数据的整理与图示

对于顺序数据,除了可使用上面整理的频数、比例、百分比、比率、条形图、饼图等,还可以计算累积频数和累积频率(百分比)

  1. 累计频数和累积频率
    • 累积频数:将各有序类别或组的频数逐级累加起来得道的频数,分为向上累积和向下累积。
    • 累积频率:也叫累积百分比,是将各有序类别或组的百分比逐级累加起来。

3.3 数值型数据的整理和展示

分类和顺序数据的整理和图示方法,也都适用于数值型数据,但是数值型数据还有一些特定的整理和图示方法,它们并不适用于分类数据和顺序数据。

3.3.1 数据分组

  • 单变量分组
  • 组距分组(等距分组、不等距分组)

3.3.2 数值型数据的图示

  1. 分组数据
    • 直方图(histogram)
  2. 未分组数据
    • 茎叶图(stem-and-leaf-display)
    • 箱线图(box plot):一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)
  3. 时间序列数据
    • 线图
  4. 多变量的图示
    • 散点图
    • 气泡图 可用于展示三个变量之间的关系
    • 雷达图(radar chart)也叫蜘蛛图(spider chart),可以显示多个变量的关系

本文来自于《统计学》第六版

原创粉丝点击