R语言学习十一

来源:互联网 发布:linux驱动加锁的情况 编辑:程序博客网 时间:2024/06/05 10:30

广义线性模型

以前的线性模型用来分析变量分布,因变量多为正态分布,对于类别型变量和计数型并不合理,针对这些问题,可以考虑广义线性模型,情况如下:
这里写图片描述
glm()函数
R中可以使用glm函数来拟合广义线性模型,函数的基本形式为:
glm(formula,family=family(link=function),data=)
glm函数的常见参数如下:
这里写图片描述
glm函数可以拟合许多流行的模型,比如Logistic回归,泊松回归和生存分析
假设有响应变量Y,三个预测变量x1,x2,x3和一个包含数据的数据框
mydata
这里写图片描述
Logistic回归
Logistic回归多用于通过一系列连续型和类别型预测变量来预测二值型结果变量
下面将通过一个对婚外情的数据的研究来逐步讲解Logistic回归
这里写图片描述
因为我们只关心此人有没有婚外情,所以可以把数值二值化,将等于0的表示从来没有过婚外情的,大于等于1的表示出现过婚外情。
这里写图片描述
从上图中最后一列的p值,可以看出,性别、年龄和是否有孩子对结果影响都不大,所以可以去掉这些变量重新拟合:
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
泊松回归
泊松回归多用于通过一系列连续型和类别型的变量来预测计数型结果的变量
这里写图片描述
这里写图片描述
这里写图片描述
下面来拟合泊松回归:
这里写图片描述
这里写图片描述
这里写图片描述

0 0