使用对数线性模型处理野生动物的存在/不存在数据

机器算法验证 r 广义线性模型 对数线性
2022-03-28 18:50:20

我正在开展一个项目,在该项目中,我比较了接受三种不同处理的湿地之间一些鸟类和爬虫类物种的存在/不存在。在两个不同的年份对人口进行了调查。所以响应变量是二元分类变量,预测变量(湿地处理和采样年份)也是分类变量。

情况变得有点复杂,因为两年之间使用了不同的抽样时间表,导致两年之间的样本量不同。我正在研究使用 R 中的 glm() 函数对动物存在/不存在进行建模,但我不确定是否有更合适的方法?

2个回答

您可以使用二项式 GLM,因为它提供了对不同样本大小进行建模的自由,mi. 因此,您可以按如下方式使用 glm() 函数:

glm(cbind(presence, absence) ~ 1 + treatment + year, family=binomial)

其中“在场”和“缺席”显示在场或不在场的病例数。

我强烈推荐你 R 书,第 15 章到第 17 章。如果你只有分类变量而没有连续变量,Crawley 的 R 书建议制作一个列联表或将你的二进制数据转换成比例数据然后分析它。我有同样的问题(二进制计数数据和只是分类解释变量)并制作了二项式 GLM,后来又制作了一个带有计数比例数据的 GLM。两者都工作得很好,结果是一样的。