我应该将时间视为 GLMM 中的固定效应还是随机效应?

机器算法验证 时间序列 随机效应模型 固定效应模型 咕噜咕噜
2022-03-29 03:26:45

我正在尝试确定一种农药是否会影响特定鸟类的数量。我有 35 年的数据,这些数据是在每年运行的路边调查路线上收集的(繁殖鸟类调查)。我也在考虑环境变量,例如土地利用和气候变量。

我应该将“年”作为固定效应还是随机效应包括在内?我需要考虑这样一个事实,即鸟类数量随着时间的推移而减少,而杀虫剂的使用却在增加。

我当前的代码如下所示:

BBS.1 <- glmmadmb(abun ~ pmdi + avail + rte.pest + rte.dev + rte.ag + rte.precip + rte.temp + (1|year) + (1|eco) + (1|rte.num), data = mybbs, family = "nbinom")

在哪里:

  • abun = 鸟类丰富度
  • pmdi = 干旱指数
  • 效用 = 1/(到 ag 的距离 + 1)
  • rte.pest = 路线内使用的农药公斤数(使用 GIS 缓冲 0.5 公里)
  • rte.dev = 路线内的已开发区域
  • rte.ag = 路线内的农业区
  • rte.precip = 路线内的年降水量
  • rte.temp = 路线内的平均每月最高温度
  • 年份 = 进行调查的年份(35 年可能的因素)
  • eco = 生态区(具有 6 个可能的生态区的因子)
  • rte.num = 路由 ID 号

我发现了一个类似的问题,以前有人问过,但从未得到回答。我非常感谢您能够提供的任何帮助!

1个回答

我认为它可能比“固定”或“随机”效果更复杂一些。你似乎暗示的是,多年来鸟类数量明显下降。可能不知道的是,这是否可以用回归中现有变量的值来解释。理想情况下,您将包括所有可能影响丰度而不是年份的变量,但似乎您可能有一些与时间相关的未测量变量。

如果您为每个可能的年份都包含一个系数(将其视为一个因素),这将导致一个相当饱和的模型,并且您可能会得到其他变量的有偏系数估计。

如果您将年份视为随机效应(即,对于每一年,效应都是从固定的正态分布中随机抽样的),那么您忽略了随机效应可交换的要求,因此这似乎也不合法。

如果您将年份作为线性预测变量包含在内(即,该年份有一个系数,可能以研究中点年份为中心),如果未测量变量的实际影响是非线性的,您可能会遇到问题。这可以通过检查预测残差与年份协变量来检查。

我的建议是执行以下操作:

  • 绘制丰度(对数转换)与年份的关系图,以查看整体结构的样子。如果它似乎是线性的,则尝试将年份添加为线性预测变量(固定效应)并检查残差与年份之间的关系。

  • 在没有年份的情况下运行您的模型作为预测变量,并检查该模型的残差与年份之间的关系——如果存在某种形式的结构,那么您需要以某种方式对其进行解释。

  • 也许考虑在回归中使用分数多项式,因为这些可以非常灵活,而不会显着增加模型的复杂性。在这种情况下,您将需要重新调整年份,使其始终为正但不会太大。

希望对您有所帮助...