我的数据结果为 0 或 1(二进制),代表成功或失败。我也有两个比较组(治疗组与对照组)。研究中的每个受试者都贡献了 2 个观察结果(治疗是滴耳剂,所以 2 个耳朵)。我想对数据进行建模并寻找治疗和控制之间的差异。我运行了作为条件模型的广义线性混合模型 ( PROC GLIMMIXin ) 和边缘SAS模型 GEE ( PROC GENMODin )。SAS我对两组结果概率的估计非常相似,并且值也相似。我的问题是,边际模型和条件模型之间有什么区别,一般来说,在这个问题的背景下,我怎么知道选择哪个以及何时选择?
条件模型与边际模型
机器算法验证
咕噜咕噜
广义估计方程
指定错误
2022-03-15 10:56:52
2个回答
您使用的任何一种模型都可能是很好的方法——结果相似当然令人放心。
边际模型是人口平均模型,而条件模型是特定于主题的。因此,在解释上存在细微差别。例如,如果您正在研究 BMI 对血压的影响并且您使用的是边际模型,您会说“BMI 增加 1 个单位与血压单位平均增加相关”,而有条件的在模型中,您会说“BMI 增加 1 个单位与血压
Diggle、Liang 和 Zeger (1994) 建议在研究的目标是进行基于人群的推论时使用边际模型(在流行病学环境中通常是这种情况),并在试图做出关于个人反应的推论。
然而,许多其他人认为,条件模型应该始终优于边际模型,因为条件模型可以包含条件和边际效应。例如,参见 Lee 和 Nelder (2004)。
我个人更喜欢使用边际模型,但那是因为我经常担心模型错误指定(但你可能不会)。边际模型非常稳健,不太容易受到随机效应错误指定的偏差的影响(显然)。参见 Heagerty 和 Kurland (2001)。
可以将边际模型视为提供回归系数的粗略估计[即未针对受试者进行调整],而条件模型具有假设为受试者共有的回归系数,因此对受试者的估计进行了调整。从这个意义上说,人们正在询问手头的主题是否令人困惑。这是相当典型的混淆评估:通常涉及如何获得受试者。粗略和调整后的比较是一个令人困惑的问题。人们也可以主张对混杂进行相当详尽的评估。也许一个人需要截距和斜率作为主题组件。