数据与统计

来源:互联网 发布:经济型酒店数据分析 编辑:程序博客网 时间:2021/11/29 07:41

书籍:《Statistics for Business and Economics,11ed 2011 Anderson》

第一章 数据与统计

数据的基本概念

数据(Data)
数据集(Dataset):为了某一研究而收集的所有数据
元素(Element):所要研究的对象,如表1.1每个基金就是一个元素
变量(Variance):关于元素感兴趣的特性。表1.1中从Fund Type 到Morningstar Rank 共5个变量
观测(Observation):针对每个元素收集其所有变量的测量值即为一条观测。如表1.1中第一条观测为:IE,14.37,30.53,1.41,3-star
这里写图片描述

数据尺度

标称尺度(nominal scale):变量的尺度用标签或者名称来表示,如Fund Type变量的数据。
有序尺度(ordinal scale):当标称尺度的排序有意义时,则为有序尺度,如Morningstar Rank变量的数据。
区间尺度(interval scale):有序+两个数的差(区间)是固定数值。
比率尺度(ratio scale):区间尺度的特征 + 两个数的比值有意义。

分类数据与定量数据

分类数据(categorical data):数据一般为标称或有序尺度。
定量数据(quantitative data):数据一般为区间或比率尺度。

面板数据与时间序列

面板数据(cross-sectional data):同一时间点收集的数据
时间序列数据(Time series data)

数据源

  • 来自现有系统数据
  • 通过实施某一统计研究来获取数据:统计研究获取的数据又分为实验研究(experimental study)与观测研究(observational study)。
    实验研究:要用到控制变量的方法。如某一公司要研究药物剂量对血压的影响,那么需要对药物剂量进行控制,实验组与对照组需要分别给予不同的药物剂量。
    观测研究:设计问卷调查

描述统计(descriptive statistic):对数据进行概括,并用图表的形式进行展现,其目的是为了方便读者了解。

总体(population),普查
样本(sample),抽样调查
统计推断(statistic inference):通过样本对总体特征进行估计和假设检验的过程。
精度(precision)
自信度(confident)

0 0