vlambda博客
学习文章列表

R语言—线性回归分析(2)

(一)多元线性回归
以state.x77数据集为例进行介绍。

#多元线性回归

>states<-as.data.frame(state.x77[,c("Murder","Population","Illiteracy","Income","Frost")])#转化为数据框

>fit<-lm(Murder~Population+Illiteracy+Income+Frost,data = states)

>summary(fit)

>coef(fit)#查看变量系数

Residuals表示残差的分位点。包括最小点 、1/4、中位点、3/4、最大点;Estimate表示回归方程参数的估计;Std.Error表示回归方程参数的标准差;T检验是检验解释变量的显著性的;F检验是检验方程整体显著性的。

Multiple R-squared和Adjusted R-squared这两个值,我们常称之为“拟合优度”和“矫正的拟合优度”,是指回归方程对样本的拟合程度。

F-statistic,也就是我们常说的F统计量,也称为F检验,常用于判断方程整体的显著性检验。

本例中P值为9.13e-08,显然是p<0.001的,我们可以认为方程在P=0.001的水平上还是通过显著性检验的。Multiple R-squared=0.567,说明此模型可以解释各州谋杀率57%的方差。从整体来说,此模型的拟合程度并不是很好。不过,我们可以应用AIC函数进行比较,选取最佳的回归模型。这部分内容大康下期再来介绍!

(二)存在交互项的线性回归
以mtcars数据集为例进行介绍。

#存在交互项的线性回归

> fit<-lm(mpg~hp+wt+hp:wt,data=mtcars)

> summary(fit)

R语言—线性回归分析(2)

两个变量的交互项显著,说明响应变量与其中一个预测变量的关系依赖于另外一个预测变量的水平,因此本例中表明每加仑汽油行驶英里数与汽车马力的关系依车重不同而不同。

扫描二维码

获取更多精彩

大康的笔记

R语言—线性回归分析(2)