机器学习笔记(五)--贝叶斯统计
来源:互联网 发布:java在线拍卖系统源码 编辑:程序博客网 时间:2024/05/17 02:50
简介
我之前已经讨论过如果来通过MAP来估计
贝叶斯统计的核心就是通过后验统计来来总结关于我们不知道的变量的一切知识。在第6章会有通过经典统计学来做的内容。
后验分布的总结
后验分布
MAP估计
我们已经可以很容易的通过计算后验的平均,中位数,众数来估计一个未知数。总体来说,对于一个连续变量来说,平均和中位数是对连续数据的很好的估计,对于一个离散的数来说,计算后验边缘分布是一个很好的选择。为什么MAP那么流行,是因为它可以把计算规约到一个最优化问题。并且MAP也可以看做一个非贝叶斯的方法,只要把先验看做一个正则就可以了。
尽管MAP讨论了那么多优点,但是MAP也有很多缺点,接下来我们会讨论MAP的缺点。这也就提供了我们讨论更全面的贝叶斯方法来进行估。
对于估计没有置信度区间
MAP最致命的一个缺点就是对于估计的参数没有置信度估计。只是提供了一个对于未知数的估计。当然,我们可以在接下来的内容里去完善估计的置信度。
会导致过拟合
在机器学习的领域,我们很多时候更多的会关注预测的准确性而不是去解释我们模型的参数的含义,这就会导致过于相信模型的结果。也就是会导致过拟合。
众数是一个非典型性的指标
有的时候使用后验分布的众数是非常弱的选择,因为它不像平均数和中位数,对于分布来说是非典型的。
置信区间
置信区间,我们一般会使用中心置信区间,也就是
贝叶斯模型选择
如果我们有很多的模型,有的时候不知道选哪个的时候,我们一般会使用CV,通过计算生成错误来选择模型,但是一种更为有效的方式是通过计算后验概率来进行选择。也就是我们会计算
- 机器学习笔记(五)--贝叶斯统计
- 机器学习笔记五
- 统计机器方法学习笔记(2)
- 统计学习笔记(五)决策树
- 机器学习笔记(五)——朴素贝叶斯分类
- Andrew Ng 机器学习笔记(五)
- 机器学习课堂笔记(五)
- 机器学习笔记(五):numpy入门
- 机器学习笔记(五) 神经网络
- 机器学习笔记(五) octave入门
- 统计机器方法学习笔记
- 《统计学习方法》学习笔记五
- 机器学习笔记(五)神经网络
- 斯坦福机器学习笔记五
- 机器学习系列笔记(五)
- 《统计学习方法》笔记(五)--朴素贝叶斯
- Memcached (统计命令)-- 学习笔记(五)
- node学习笔记(五)网站访问量统计功能实现
- SVN 中创建Trunk、Branches、Tags 过程
- 大数据读书笔记(1)
- linux mkisofs命令制作光盘*.iso
- Python程序实现批量创建/重建空间索引
- Django 中的 WSGI
- 机器学习笔记(五)--贝叶斯统计
- SharedPreferences
- Linux下定时执行脚本。转自:http://www.blogjava.net/decode360/archive/2009/09/18/287743.html
- 机器学习复习——Logistic回归
- 汇编语言第5章循环程序设计
- iOS 应用发布流程
- 如何在程序中动态设置墙纸
- asp.net开发中利用jquery来实现滚动下拉标题浮动固定显示
- Python中subprocess学习