统计学系列:统计、数据与思想

来源:互联网 发布:it服务外包解决方案 编辑:程序博客网 时间:2024/04/23 15:11

  统计(statistics)是数据的科学,涉及数据的收集、分类、汇总、组织、分析以及数字信息的解释。统计分为两种:描述统计和推断统计。
  
  描述统计,利用数字或者图表的方法,寻找数据集的规律,总结其中的信息,并以恰当的方法展现这些信息。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
  我的理解:根据样本数据本身的内容进行统计分析的,描述的是样本客观的一些规律、信息等。比如,从一堆苹果中随机挑选出部分东西,挑选出来的部分是圆的、红色的、平均重100g等这些数据就是统计分析。
  
  推断统计,利用样本数据的信息,对总体的情况做出估计、推断、预测或其他归纳。推断统计是研究如何利用样本数据来推断总体特征的统计方法。包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。
  我的理解:根据样本的数据,推断、估计、预测出总体的情况。比如,从一堆苹果中随机挑选出部分东西,挑选出来的部分是圆的、红色的、平均重100g等,根据这些数据猜测那一堆苹果都是圆的、红色的、平均重100g,得出的结论是推断统计。
  
  推断统计之所以出现,是因为没有办法知道总体的数据,如果能够知道所有的数据,那么估计只需要描述统计就可以了,如果这样统计学也就不存在了,统计的核心问题就是:抽样 。
  这里写图片描述
  
  
  数据的类型分为:定量数据(数值)和定性数据(分类)。

  数据的收集的方法:
     - 观察,也就是自己观察记录,自己动手丰衣足食
     - 公开发表的资料,去一些公开的网站,比如统计年鉴、数据堂等网站下载资料
     - 调查,发问卷
     - 设计实验,获得一些实验数据
     - 利用互联网,通过爬虫可以爬取到很多很有用的数据

  非随机样本的问题:
    1、选择偏差
    2、无应答偏差
    3、测量误差
  关于这个问题,有一本书《统计学会撒谎》,这本书中有一些很有趣的小例子生动形象的描述了使用统计学歪曲事实,前面有几章讲解的就是非随机样本的问题,利用非随机样本会产生误差进行扭曲事实。

参考资料:
《麦克拉夫商务与经济统计学》
    

0 0
原创粉丝点击