The Difference between Probability and Statistic

来源:互联网 发布:武汉淘宝服装摄影师 编辑:程序博客网 时间:2024/05/21 06:54

【本科数学专业,现在在PKU学习计算机,当前主要的focus是DNN&RNN in Action Recognition。心中总有一股数学情结,OOAD 课程上老师提及这个问题,所以信誓旦旦地想写一篇博客。可惜最后发现雷声大,雨点小,先mark在这里,以后再做完善和修改吧。】

【特别声明一下,成文之前在自己思考的框架内,部分参考了知乎上的观点,郑重致敬】

【趁机在CSDN上刷了一拨存在感,传了几个原创文档,加上了这篇博客,算是给自己一个好的开端吧微笑


1. 探讨概率(probability)和统计(statistic)的关联和区别,有如下类似的表达:

1)概率论和统计学;

2)概率论和数理统计。

   这里,因为我们的focus是二者的关系,所以从广义上把这三组概念等价看待。


2. 在应用中,二者共同的落脚点都是基于概率建模,并预测未来走向。

(1)概率论的核心内容有:……;数理统计的核心内容是:……;

(2) 概率是对未知推断(基于事件本身属性对应的模型规律),统计是已知归纳(基于事件的历史观测数据分析);

(3) 概率是数学导向应用,统计是数据驱动应用;(新新范畴,数据挖掘和统计学习;不老传奇:贝叶斯概率模型)

(4)概率论和统计学的产生过程交织:……;现如今学习和授课中,概率论一般在数理统计之前,然后很多时候二者是共同作用的;

(5) 两张图:



3. 我对这个问题的思考准备

      本科时学习数学专业,包括分析,代数,概率,几何的基础课程,也包括之后的抽象代数,实变函数,测度论,泛函分析等“进阶”课程。

在学习过程中,常常需要理解不同课程中大量相关联的概念和定义,我时常自发地做类似的辨析和归纳,对于此类问题及其思考模式并不陌生。

     概率论作为数学的重要分支,从小学时就开始接触相关的内容(比如掷硬币,频率计算,统计图等等)。大学里,直接相关的课程很多,包括:理论性的《概率论和数理统计》,《测度论》,《多元回归分析》,《随机过程》等等,应用性的《信息论》,《SAS和数据分析》,《条件概率和决策论》等等,新新范畴的《数据挖掘和统计学习》,《贝叶斯网络和概率图》等等。而我自己本科学习的第一门概率方面的课程是《概率论和数理统计》,由MUC陈方樱教授授课,采用的教材是由她自己主编的。

     事实上,提及概率和统计的概念辨析,似乎从一开始二者就紧密地交织在一起的。这一点的直接体现便是,问题求解的计算过程都是P主导,结果输出都是各种统计特征变量(均值,方差,标准差),结果解释往往都涉及数据离散和集中程度以及各种统计图表。

     第一次感受到区别,是在接触概率的公理化定义和基于微积分定义各种分布密度的时候。之后又学习了大数定律和中心极限定理的,概率和统计的分界线便十分清晰了。

【写作本文时,中间因为午饭和午休耽搁了,所以直接导致思路断层,虎头蛇尾,惭愧;另外,深切感到午休之后肝供血不足,整个人都焦了】


1 0