通用线性模型(GLMs,Generalized Linear Models)
来源:互联网 发布:知乎的经典评论 编辑:程序博客网 时间:2024/06/05 20:55
- 预备知识
- 问题
- 总结
相信对于大部分机器学习的初学者,都会看了斯坦福大学吴恩达的机器学习公开课,听过的话对于通用线性模型(GLM,Generalized Linear Models)获取有一点不太理解,尤其是像我一样对于一些数学知识不太了解的同学。这篇博客就写一下我对通用线性模型的理解,这只是我的理解,不一定正确,如果有不同的理解或者我理解错的点,请评论互相交流,谢谢O(∩_∩)O~~
预备知识
再讲通用线性模型之前一般都会学习线性回归和Logistic回归,在求解回归问题时的迭代方法,这两种回归方式的求解都有相似的迭代公式(吴恩达讲义中的表示)
在构造通用线性模型之前,首先做了三个假设:
(1)
y|x;θ∼ExponentialFamily(η) 即y是参数为η 的指数族分布
(2) 我们的假设h ,应该满足h(x)=E(h(y)|x)
(3) 假设第一条假设中指数组分布的参数η 与x 是有线性关系的,即η=θTx 。
下面将会探讨我说想到的问题。
问题
- 1、为什么要假设
y∼ExponentialFamily(η) ? - 2、第二条假设
h(x)=E(h(y)|x) 有什么依据吗? - 3、为什么要假设参数
η 与x 是有线性关系的? - 4、通用线性模型到底揭示了什么,和线性回归模型以及Logistic回归模型是什么关系?
- 5、在讲解Softmax回归过程中,为什么要将
T(y) 写成一个向量的形式?
以上便是我在学习通用线性模型过程中思考的几个问题。
- 1、为什么要假设
y∼ExponentialFamily(η) ?
我的思考:其实对于这个问题,我并没有想明白,如果你想明白了或者有答案请留言评论。对于Exponential Family(可以参考Wikipedia),其实我们常见的很多分布都是属于Exponential Family,我们常见的有正态分布、beta分布、Poisson分布、gamma分布、categorical分布等等。以我现在的思考以及我有限的统计学知识来看,我感觉
- 2、第二条假设
h(x)=E(h(y)|x) 有什么依据吗?
我的思考:其实这是一个比较好理解的假设,我们通过
- 3、为什么要假设参数
η 与x 是有线性关系的?
我的思考:至于这一条假设,完全是由于通用线性模型中的“线性”这两个字的关系,如果推广到更加通用的模型中,我认为完全可以可以把这个假设推广到更一般的函数,即
- 4、通用线性模型到底揭示了什么,和线性回归模型以及Logistic回归模型是什么关系?
我的思考:我认为,通用线性模型是从统计学的角度进行思考,而对于线性回归也许是从数值分析的角度进行思考。
首先对于线性回归,如果学过数值分析的话也许就会觉得和数值分析的插值逼近很像,而数值分析中的差值逼近却可以模拟任意阶的函数,不止是线性函数。比如对于本应该符合二次函数的数据集,我们用线性回归模型绝对不能很好的进行预测,这时候可以这样假设
然后对于通用线性模型,与前面不同,我在构架模型的过程中并没有从全局的
注:如果我们假设
- 5、在讲解Softmax回归过程中,为什么要将
T(y) 写成一个向量的形式?
我的思考:关于这个问题,我在wikipeia上的Categorical distribution上找到了答案,我就不再赘述,这样假设其实是一种等价的假设方法。我将主要内容粘贴如下,有兴趣的同学可以查看完整词条。
another formulation makes explicit the connection between the categorical and multinomial distributions by treating the categorical distribution as a special case of the multinomial distribution in which the parameter n of the multinomial distribution (the number of sampled items) is fixed at 1. In this formulation, the sample space can be considered to be the set of 1-of-K encoded random vectors x of dimension k having the property that exactly one element has the value 1 and the others have the value 0. The particular element having the value 1 indicates which category has been chosen.The probability mass function f in this formulation is:
wheref(x|p)=∏i=1kpxii pi represents the probability of seeing elementi and∑ipi=1 .
总结
有了以上思考之后,我们就不难理解通用线性模型与线性回归之间的管理,可以看到通用线性模型是更加简单通用的模型,我们只需要考虑
说明:以上内容只是基于我现有只是对通用线性模型的思考,也许并不正确,有错误的地方希望大家指正。
- 通用线性模型(GLMs,Generalized Linear Models)
- 广义线性模型--Generalized Linear Models
- 1.1 Generalized Linear Models 广义线性模型
- Generalized Linear Models广义线性模型
- 广义线性模型(Generalized Linear Models)
- 广义线性模型(Generalized Linear Models)
- Machine Learning—Generalized Linear Models广义线性模型
- 广义线性模型(Generalized Linear Models, GLM)
- 广义线性模型(Generalized Linear Models, GLM)
- 指数族和广义线性模型(The exponential family and Generalized Linear Models)
- 机器学习笔记1_3:广义线性模型(GLM, Generalized Linear Models)
- 指数分布族(The Exponential Family)与广义线性模型(GLM,Generalized Linear Models)
- scikit-learn学习笔记(三)Generalized Linear Models ( 广义线性模型 )
- 机器学习笔记——广义线性模型(Generalized Linear Models, GLM)
- 4 Generalized linear models
- generalized Linear Models
- 广义线性模型Generalized Linear Model (GLM)
- 广义线性模型(Generalized Linear Model)
- Spring security的图片验证码方案二
- 内部类被private来修饰
- 生成对抗网络(GAN)
- 周常总结
- 利用@media screen实现网页布局的自适应
- 通用线性模型(GLMs,Generalized Linear Models)
- MyBatis的statementType="STATEMENT"
- python中数据类型转换
- Ecshop会员注册的Email 电子邮箱改成非必填项
- 【CSS】浅谈CSS中的包含块
- redis集群 cluster-migration-barrier属性踩坑
- Django 博客系统------登录注册功能
- Java乐观锁悲观锁、synchronized,重入锁 (ReentrantLock)处理并发(互斥同步、非互斥同步)
- 家庭网络环境下基于OSGI的灵活授权