MLaPP Chapter 6 Frequentist statistics 频率学派统计学
来源:互联网 发布:linux强制删除用户命令 编辑:程序博客网 时间:2024/05/01 23:52
6.1 Introduction
频率学派统计学(frequentist statistics),经典统计学(classical statistics),或者叫正统的统计学(orthodox statistics),设计了一些不把参数当做随机变量的统计推断方法,从而避免了使用贝叶斯法则和先验。
频率学派依赖于抽样分布(sampling distribution),而贝叶斯学派则依赖后验分布(posterior distribution)。
6.2 Sampling distribution of an estimator 估计量的抽样分布
和贝叶斯学派相反,频率学派估计参数时,认为参数是固定的(而不是不确定量,不当做是随机变量,因此也没有先验之说),反而数据是不固定的,可以不断地抽样。比如从总体中抽
针对每个样本
6.2.1 Bootstrap
一般用蒙特卡洛方法来估计抽样分布(sampling distribution),这种方法就叫做 Bootstrap 方法,而这种方法又分有参数和无参数两种。
继续用上一小节的符号,直接计算 estimator 的结果,每个样本都会得到一个随机变量的取值,
6.2.2 Large sample theory for the MLE *
当样本数量趋向无穷大时,那么似然函数的分布趋向于高斯分布,那么高斯分布的中心就是 MLE 的估计结果
Fisher information matrix 定义为 observed information matrix 的期望,
6.3 Frequentist decision theory 频率学派决策理论
上一章已经有了 estimator or decision procedure
6.3.1 Bayes risk 贝叶斯风险
第一种方法是加上一个合适的先验,发现会把未知量
6.3.2 Minimax risk 最小最大风险
然而频率学派的数学家并不喜欢加先验,所以有了第二种方法。定义 maximum risk 为
6.3.3 Admissible estimators
完全不造在讲啥。。。
6.3.3.1 Example
6.3.3.2 Stein’s paradox
6.3.3.3 Admissibility is not enough
6.4 Desirable properties of estimators 想要的估计量性质
将会讲述estimators的一些性质。
6.4.1 Consistent estimators 一致估计量
如果随着样本集的增大,估计量(estimator)会逐渐逼近真实的参数,那么就说这个估计量是一致的(consistent)。即
6.4.2 Unbiased estimators 无偏估计量
估计量的偏置(bias)可以定义为:
6.4.3 Minimum variance estimators 最小化方差估计量
Crame-Rao lower bound 证明了方差的下限,而极大似然估计是达到了该下限的,所以 MLE 是渐进最优的(asymptotically optimal)。
6.4.4 The bias-variance tradeoff 偏置-方差之间的权衡
如果考虑均方误差,那么可以推导出
6.4.4.1 Example: estimating a Gaussian mean
MAP 虽然是有偏估计,但是降低了方差。
6.4.4.2 Example: ridge regression 岭回归
岭回归使用高斯先验,
6.4.4.3 Bias-variance tradeoff for classification
对于分类问题而言,bias-variance tradeoff 不是很有用,可以选用交叉验证来估计损失。
6.5 Empirical risk minimization 经验风险最小化
频率决策理论有个很大的问题,就是没办法直接计算风险函数。可以考虑把损失函数
那么经验风险(empirical risk)可以定义如下,
如果是非监督问题,可以把所有的
定义无监督问题的经验风险,
6.5.1 Regularized risk minimization 正则化风险最小化
假如把经验分布当做先验分布,那么经验风险就等价于贝叶斯风险,
对于函数
6.5.2 Structural risk minimization 结构风险最小化
通过结构风险最小化来找到最优的预测函数,
6.5.3 Estimating the risk using cross validation 用交叉验证估计风险
我们平常把数据分成训练集,验证集的做法,不叫交叉验证,下面讲述交叉验证的做法。定义用来查找最优化参数
定义
可以把训练和预测两个步骤(书里叫做 fit-predict cycle)合起来表示,
考虑把原始数据集
假设第
考虑一种极端的情况,取
6.5.3.1 Example: using CV to pick λ for ridge regression
上面的公式是通用的,现在举岭回归的例子来讲解。我们选
对于分类问题,可以用蛮力搜索参数空间;但是参数过多时,一般会选用经验贝叶斯,可以用一些基于梯度的优化器(optimizer)来搜索解空间。
6.5.3.2 The one standard error rule 标准误差
前面一直在讲怎样估计风险,一直没有给出不确定性度量。可以定义平均标准误差(standard error of the mean)为,
6.5.3.3 CV for model selection in non-probabilistic unsupervised learning
路过~
6.5.4 Upper bounding the risk using statistical learning theory * 用统计学习理论来估计风险上界
这一小节可以参考李航的《统计机器学习》第一章和 cs229 公开课的 Part VI Learning Theory
利用交叉验证的方法来估计经验风险,有个很大的问题就是非常慢,因为要训练好多次。而 统计学习理论(SLT, statistical learning theory)的方法则试图找到 泛化误差上界(Upper Bound)。
假如分布
Theorem 6.5.1 经验风险误差上界为
P(maxh∈H|Remp(D,h)−R(p∗,h)|>ϵ)≤2dim(H)e−2Nϵ2
这个上界可以通过 Hoeffding’s inequality 和 union bound 直接得到,具体函数和定理的证明略过。
从误差上界的表达式来看,假设空间
从另一个角度来看,更复杂的模型虽然不会增加训练集上的误差,但是一般会有更多的参数,那么参数空间(也就对应假设空间)也会更大,即
误差上界的方法确实比交叉验证要快,然而对很多模型,
6.5.5 Surrogate loss function
这一小节提到的 binary logistic regression 没看懂,先挖个坑;还有怎么 log-loss 就能退出来极大似然估计了?
Log-loss 是一种代理损失函数(surrogate loss functions),另一种注明的代理损失函数就是合页损失(hinge loss),
6.6 Pathologies of frequentist statistics * 频率统计的病态
6.6.1 Counter-intuitive behavior of confidence intervals
6.6.2 p-values considered harmful
6.6.3 The likelihood principle
6.6.4 Why isn’t everyone a Bayesian
- MLaPP Chapter 6 Frequentist statistics 频率学派统计学
- MLaPP Chapter 5 Bayesian statistics 贝叶斯统计
- 频率论学派(传统数理统计学)和贝叶斯统计学比较
- 贝叶斯统计(Bayesian statistics) vs 频率统计(Frequentist statistics):marginal likelihood(边缘似然)
- 频率学派与贝叶斯学派
- 频率学派和贝叶斯学派
- 贝叶斯学派与频率学派
- 【贝叶斯学派】与【频率学派】
- MLaPP Chapter 1 Introduction
- MLaPP Chapter 1 Introduction
- 频率学派(Frequentists) 贝叶斯学派(Bayesians)
- 频率学派与贝叶斯学派的区别
- 【机器学习】频率学派和贝叶斯学派
- 频率学派和贝叶斯学派的区别
- 再谈贝叶斯学派与频率学派的区别
- 贝叶斯学派与频率学派的不同
- 频率学派和贝叶斯学派的参数估计
- MLaPP Chapter 2 Probability 概率论
- VS2010动态库只生成DLL不生成LIB的解决方法
- 将一个Android项目作为另一个Android Library给其他项目使用
- Android 内存释放与泄漏的一点理解
- 【高并发简单解决方案】redis队列缓存 + 批量入库 + php离线整合
- 【那些年遇到过的面试题】 grep find 区别
- MLaPP Chapter 6 Frequentist statistics 频率学派统计学
- 逻辑思维训练(一)
- AndroidStudio MAT内存分析
- 去除Android 6.0 界面下的导航栏:NavigationBar
- selenium+Python初学问题合集
- 使用PDFBox处理PDF文档
- Linux文件系统及文件储存方式
- 第一个Win32程序
- 【JSTL】JSP标准标签库(二)——核心标签库