使用 Stan 和前端包rstanarm,或者brms我可以像以前使用混合模型(例如lme. 虽然我的办公桌上有 Kruschke-Gelman-Wagenmakers 等的大部分书籍和文章,但这些并没有告诉我如何为医学观众总结结果,在贝叶斯愤怒的 Skylla 和医学评论家的 Charybdis 之间徘徊( “我们想要意义,而不是那些分散的东西”)。
一个例子:胃频率(1/min)分三组测量;健康对照是参考。每个参与者都有几个测量值,所以我使用了以下混合模型lme:
summary(lme(freq_min~ group, random = ~1|study_id, data = mo))
稍微编辑的结果:
Fixed effects: freq_min ~ group 
                   Value Std.Error DF t-value p-value
(Intercept)        2.712    0.0804 70    33.7  0.0000
groupno_symptoms   0.353    0.1180 27     3.0  0.0058
groupwith_symptoms 0.195    0.1174 27     1.7  0.1086
为简单起见,我将使用 2* 标准误差作为 95% CI。
在常客的背景下,我将其总结为:
- 在对照组中,估计频率为 2.7/min(可能在此处添加 CI,但我有时会避免这样做,因为绝对 CI 和差异 CI 会造成混淆)。
 - 在 no_symptoms 组中,频率比对照组高 0.4/min,CI(0.11 至 0.59)/min,p = 0.006。
 - 在 with_symptoms 组中,频率比对照组高 0.2/min,CI(-0.04 到 0.4)/min,p = 0.11。
 
这大约是医学出版物可接受的最大复杂性,审稿人可能会要求我在第二种情况下添加“不显着”。
这与stan_lmer默认先验相同。
freq_stan = stan_lmer(freq_min~ group + (1|study_id), data = mo)
           contrast lower_CredI frequency upper_CredI
        (Intercept)     2.58322     2.714       2.846
   groupno_symptoms     0.15579     0.346       0.535
 groupwith_symptoms    -0.00382     0.188       0.384
其中 CredI 是 90% 的可信区间(请参阅 rstanarm vignette 为什么使用 90% 作为默认值。)
问题:
- 如何将上述总结转化为贝叶斯世界?
 - 在多大程度上需要事先讨论?我很确定当我提到先验时,这篇论文会带着通常的“主观假设”回来。或者至少“请不要进行技术讨论”。但是所有贝叶斯权威都要求解释仅在先验的情况下有效。
 - 在不背叛贝叶斯概念的情况下,我如何在公式中提供一些“意义”替代?像“令人难以置信的不同”(uuuh ...)或几乎令人难以置信的不同(buoha ...,听起来像“在意义的边缘)。
 
乔纳·加布里和本·古德里奇 (2016)。rstanarm:通过 Stan 进行的贝叶斯应用回归建模。R 包版本 2.9.0-3。 https://CRAN.R-project.org/package=rstanarm
斯坦开发团队(2015 年)。Stan:用于概率和采样的 C++ 库,版本 2.8.0。网址http://mc-stan.org/。
保罗-克里斯蒂安·布尔克纳 (2016)。brms:使用 Stan 的贝叶斯回归模型。R 包版本 0.8.0。https://CRAN.R-project.org/package=brms
Pinheiro J、Bates D、DebRoy S、Sarkar D 和 R 核心团队(2016 年)。nlme:线性和非线性混合效应模型。R 包版本 3.1-124,http://CRAN.R-project.org/package=nlme>。