id(集群)在gee中是什么意思?

机器算法验证 r 广义估计方程
2022-04-04 03:51:33

我想使用泊松 glm 模型,该模型将序列相关(AR-1)和过度分散考虑在内。我被指示使用gee,但是gee(R 中 gee 包的功能)需要参数id,我不知道这意味着什么。文档说它识别了集群,但我不知道集群概念是什么。你能解释一下gee的集群概念吗?它是否与自相关有关?

1个回答

我从未使用过这种模型,但快速谷歌搜索显示

广义估计方程 (GEE) (Liang and Zeger 1986) 是一种分析在集群中收集的数据的通用方法,其中 1) 集群内的观察结果可能相关,2) 单独集群中的观察结果是独立的,3) 期望的单调变换与解释变量线性相关,4)方差是期望的函数。必须注意,第 3) 点和第 4) 点中提到的期望和方差是有条件的给定集群级或个体级协变量。

(来源:Halekoh 和 Højsgaard,2006 年在 JSSgeepack图书馆论文中)

所以这种模型似乎是专门为集群数据设计的,如果你的数据不是集群的,那么这似乎不是适合你的模型。如果您需要一个模型来解释自相关错误,您可以尝试 GLS

至于什么是集群数据——我们说如果有一些分组结构,数据就是集群的,例如学生在学校分组,病人在医院等。如果你想考虑群体效应,那么你可以使用让你定义的模型这种结构(例如线性混合模型)。这些结构可以是分层的:学生分组在班级、学校班级、地区学校等,甚至交叉:学生在学校分组,同时按他们居住的社区分组(这可能与学校本地化不同)。