我正在拟合 GAM(在 R 中使用mgcv)来计算数据,并且不确定如何从竞争模型中进行选择。在我的模型规范中,我将"ts"其用作平滑基础和负二项分布。据我了解,这实质上为平滑增加了额外的惩罚,因此有可能在模型拟合期间帮助完全排除某些项。
我采用的建模策略如下
我首先拟合一个全局模型(即包含我所有感兴趣的自变量),例如(N~s(x1)+s(x2)+s(x3)+s(x4)). 当我发现该术语x3的 EDF 实际上等于 0 并且x4在 0.05 水平上不显着(但 EDF>1)时,我随后通过消除这两个术语来拟合模型,即N~s(x1)+s(x2).
当我比较这两个模型并发现嵌套模型(现在所有项显着且非零 EDF)具有较低的偏差解释时,这意味着什么?这也是识别重要预测变量的合理方法吗?
任何建议将不胜感激。