我试图了解如何解释通过泊松 GLM 拟合的列联表的对数线性模型。
考虑 CAR 中的这个例子(Fox 和 Weisberg,2011,第 252 页)。
require(car)
data(AMSsurvey)
(tab.sex.citizen <- xtabs(count ~ sex + citizen, data=AMSsurvey))
产量:
citizen
sex Non-US US
Female 260 202
Male 501 467
然后我们拟合(相互)独立的模型:
AMS2 <- as.data.frame(tab.sex.citizen)
(phd.mod.indep <- glm(Freq ~ sex + citizen, family=poisson, data=AMS2))
pchisq(2.57, df=1, lower.tail=FALSE)
输出:
> (phd.mod.indep <- glm(Freq ~ sex + citizen, family=poisson, data=AMS2))
Call: glm(formula = Freq ~ sex + citizen, family = poisson, data = AMS2)
Coefficients:
(Intercept) sexMale citizenUS
5.5048 0.7397 -0.1288
Degrees of Freedom: 3 Total (i.e. Null); 1 Residual
Null Deviance: 191.5
Residual Deviance: 2.572 AIC: 39.16
> pchisq(2.57, df=1, lower.tail=FALSE)
[1] 0.1089077
p 值接近 0.1,表明拒绝独立性的证据不足。但是,让我们假设我们有足够的证据拒绝 NULL(即,对于我们的目的,0.10 p 值表示两个变量之间的关联)。
问题:那么,我们如何解释这个对数线性模型?
(我们是否适合饱和模型(即update(phd.mod.indep, . ~ . + sex:citizen))?我们是否解释了估计的回归系数?在 CAR 中,由于拒绝 NULL 的证据不足,他们停在这一点上,但我有兴趣了解解释这一点的机制简单的对数线性模型,好像“交互”很重要......)



