我们使用R库mgcv,用广义加性模型(GAMs)对环境数据进行建模。mgcv是一个伟大的库,具有丰富的功能,但我们经常发现,默认的诊断图并不令人振奋。特别是偏残差图,功能很强,但不漂亮,残差几乎看不见。我们需要根据这些代码来制作自己的偏回归平滑图。
1) 基本的数据设置
我们正在使用这里讨论的数据集。我们使用的是国家发病率和死亡率空气污染研究(NMMAPS)的数据。我们将数据限制在1997-2000年。
data[date>as.Date("1996-12-31"),]
2) 简单的GAM模型--温度对臭氧
在这个例子中,我们保持模型的简单性--使用高斯数据,单一预测因子。我们对温度与臭氧进行建模,我们将输出默认的偏残差图。
# 模型 - 温度对臭氧的影响
plot(gam)
这个图可以改进?
3) 重新制作偏残差图
偏残差图(Partial Residual?Plot)是多元回归中常用的诊断工具,特别是评估模型中在一个或另一个解释变量中是否包含非线性项。在多元回归y=β0+β1x1+…+βpxp+ε中,若欲反映其中变量Xj与因变量y之间的关系并用图形显示,其方法之一是用偏残差图。
在这里,我们加入平滑项、置信区间和偏残差。
#我们可以在多边形的顶部添加线条
qplot(temp, fit, type="n")+poly(c(temp, rev(temp)),
c(low95,rev(up95))# 对于置信度的灰色多边形
在最后一步,我们要加入偏残差本身。偏残差是平滑项的估计值+整个模型的残差。
#添加偏残差。
points(temp,partial.resids)
为便于参考,这里是完整模型的摘要。
模型 - 温度对臭氧的影响?
最受欢迎的见解
1.R语言多元Logistic逻辑回归 应用案例
2.面板平滑转移回归(PSTR)分析案例实现
3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)
4.R语言泊松Poisson回归模型分析案例
5.R语言混合效应逻辑回归Logistic模型分析肺癌
6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现
7.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病
8.python用线性回归预测股票价格
9.R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
|