我正在将三个具有 Gamma 分布的相对简单的 GLM 与 AIC 和 BIC 进行比较。目的是确定肥料(fdung)、年份和地点对特定草种生物量的影响。因此,目的不是预测新值,而只是确定三个因素的影响。
以下是使用的模型:
res1 <- glm((Biomass..g.m².) ~ fdung * fyear * fblock, family=Gamma(link="identity"))
res2 <- glm((Biomass..g.m².) ~ fdung * fyear + fblock, family=Gamma(link="identity"))
res3 <- glm((Biomass..g.m².) ~ fdung + fyear + fblock, family=Gamma(link="identity"))
我希望第三种模型是最简单的模型,并希望通过信息标准来确认这一点。但是,在查看 AIC 和 BIC 时,我得到了这个输出。
AIC(res1,res2,res3) BIC(result1,res2,res3)
df AIC df BIC
res1 49 5271.617 res1 49 5465.198
res2 16 5334.234 res2 16 5397.44
res3 10 5331.253 res3 10 5370.760
对于 AIC,最复杂的模型是“最好的”,而对于 BIC,df 最少的模型是最好的。我在想,关于我的目标(确定对生物质的影响),我应该相信 BIC。
我的结论错了吗?
我已经尝试了将 fblock 作为随机因子的混合效应模型,但是具有 Gamma 分布的模型不再起作用,而且我不能再将 fblock 用作固定效应(导致 fblock 的 NA),但这不是一部分我的问题。