我需要在“洞察力”量表上每 10 分钟估计三个评估者(A、B、C)对心理治疗患者的评估洞察力的可靠性。假设该实验持续 40 分钟,对于每位患者,每位评分者给出 4 个分数,当然,时间嵌套在患者中。
我的数据集如下所示:
patient | time | rater | insight
01 | 01 | A | 35
01 | 02 | A | 38
01 | 03 | A | 31
01 | 04 | A | 25
01 | 01 | B | 43
01 | 02 | B | 41
01 | 03 | B | 41
01 | 04 | B | 43
01 | 01 | C | 35
01 | 02 | C | 41
01 | 03 | C | 44
01 | 04 | C | 42
02 | 01 | A | 14
02 | 02 | A | 23
02 | 03 | A | 18
02 | 04 | A | 17
02 | 01 | B | 22
02 | 02 | B | 24
02 | 03 | B | 17
02 | 04 | B | 17
02 | 01 | C | 35
02 | 02 | C | 24
02 | 03 | C | 18
02 | 04 | C | 12
...
根据我对此事和先前答案的 理解,我可以通过拟合以下混合模型将我的评估者之间的协议估计为“双向随机效应”ICC:
library(lme4)
fit = lmer(insight ~ (1|rater) + (1|patient/time), data=d)
Random effects:
Groups Name Variance Std.Dev.
time:patient (Intercept) 7.330 2.707
patient (Intercept) 25.418 5.042
coder (Intercept) 1.860 1.364
Residual 6.368 2.524
Number of obs: 215, groups: time:patient, 72; patient, 16; coder, 3
并计算患者方差+时间(25.42 + 7.33 = 32.75)与总方差(7.33 + 25.42 + 1.86 + 6.37 = 40.98)的比值
ICC = 32.75/40.98 = 0.799
尽管如此,没有任何文档/答案处理嵌套级别,而且我对统计论文/手册的数学符号并不精通,所以这个解决方案是一个最佳猜测解释。
问题:
- 这个程序正确吗?
- 这会是 Shrout 和 Fleiss (1979) 表示法中的 ICC(2,1) 还是 ICC(2,k)?