CS229学习笔记之生成学习算法
来源:互联网 发布:php统计网站访问人数 编辑:程序博客网 时间:2024/05/22 11:39
到目前为止,我们讨论的学习算法都是直接对
学习算法可以分为两种,一种是尝试去直接学习得到
当我们为
这里,分母可以通过
高斯判别分析
我们学习的第一个生成学习算法叫高斯判别分析,在这个模型中,我们会假设
多元正态分布
多元正态分布是在n维空间中的,其参数有:
均值向量:
协方差矩阵:
分布记作
上述等式中,
对于一个属于多元正态分布
下面给出一些正态(高斯)分布的密概率度图像(二元):
左边的图显示的分布均值为0(
让我们来看看更多的例子。
上图表示的分布均值均为0,对应的协方差矩阵为:
左边的图就是标准正态分布,而可以看到随着非对角线上数值的增大,分布在45度方向上压缩的幅度越大。通过下面的轮廓图可以更清楚地展现这个特点。
下面是最后一组例子(改变
上图对应的协方差为:
从左图和中图可以看到,随着元素值的减小(绝对值变大),分布在相反的方向上“压缩”得越明显。最后,右图中我们改变了对角线上的元素值,分布变得更趋近于椭圆。
在最后一组例子中,令
总而言之,多元正态分布与正态分布一样是钟型的曲线,参数
高斯判别分析模型
对于一个分类问题,输入变量 x 是连续随机变量,我们可以使用高斯判别分析(GDA)模型,对
其分布如下:
这里模型的参数包括
通过最大化
用图形来表示,该算法可以表示为下图:
图中展示的是训练集,求得的高斯分布以及拟合至数据中,将数据分为了两类,注意两个高斯分布的形状与方向相同,因为它们共享同一个协方差矩阵,但是它们的均值不同。此外图中的直线表示决策边界:
讨论:高斯判别分析与逻辑回归
高斯判别分析与逻辑回归之间有着有趣的关系。如果我们将
这与逻辑回归的形式完全相同。但一般来说,对于相同的数据集两种算法会给出不同的边界,究竟哪一个更好呢?
如果
相反,因为进行了更弱的假设,所以逻辑回归有更好的鲁棒性,对于错误的模型假设不那么敏感。有很多不同的假设会导致
总结:GDA进行了更强的模型假设并且数据有效性更高(需要更少的数据来学习),但其前提条件是模型假设正确或近似正确。 逻辑回归进行较弱的假设,对于模型假设偏离的鲁棒性更好。特别地,如果数据集实际上不是高斯分布,那么在数据有限的情况下,逻辑回归一般会表现得比GDA更好。因此,实际中使用逻辑回归的情况比GDA多得多。
- CS229学习笔记之生成学习算法
- [机器学习](六)cs229之EM算法
- 【机器学习 吴恩达】CS229课程笔记notes2翻译-Part IV生成学习算法
- cs229学习笔记之支持向量机
- CS229学习笔记之广义线性模型
- CS229学习笔记之朴素贝叶斯
- cs229-lecture2-学习笔记
- cs229-lecture3-学习笔记
- cs229-lecture4-学习笔记
- CS229学习笔记之线性回归与梯度下降
- CS229学习笔记之分类问题与逻辑回归
- 机器学习 cs229学习笔记1
- 【cs229】斯坦福机器学习笔记(一)
- 【cs229】斯坦福机器学习笔记(一)
- cs229 斯坦福机器学习笔记(二)-- LR回顾与svm算法idea理解
- CS229学习笔记之概率解释与局部加权线性回归
- 【斯坦福---机器学习】复习笔记之生成学习算法
- cs229 机器学习
- JDBC事务与ORM事务管理的差异与联系
- Oracle Database Transactions and Locking Revealed.pdf 英文原版 免费下载
- 500. Keyboard Row
- 分分钟用上C#中的委托和事件
- 新开博客,记录成长
- CS229学习笔记之生成学习算法
- PlexCoin创始人获罪入狱
- Beginning Objective-C.pdf 英文原版 免费下载
- 遇到了http 400
- 法国批准通过区块链技术交易非上市证券
- Python自学之路第九步——用户输入和while循环
- Codeforces Round #447 (Div. 2) B C 思维
- 哈萨克斯坦新兴组织希望在当地发展区块链
- 俄罗斯最大银行在IBM区块链上试行资金转账