我正在努力完成(TJ Diccio & B. Efron,“Bootstrap Confidence Intervals”,Statistical Science,1996, 11 (3), 189–228),甚至在我找到好东西之前我就被困住了。
在介绍中,有一个治疗前后值的表,称为cd4,相关性给出为 0.723。然后论文指出,“如果我们愿意假设双变量正
在这里,我规定我是一个统计白痴。当我在 R 中键入数据并使用 Fisher 变换或T分布手动计算置信区间时,我没有得到该区间。如何计算他们正在谈论的间隔?
> cd4
subj base oneyr
1 1 2.12 2.47
2 2 4.35 4.61
3 3 3.39 5.26
4 4 2.51 3.02
5 5 4.04 6.36
6 6 5.10 5.93
7 7 3.77 3.93
8 8 3.35 4.09
9 9 4.10 4.88
10 10 3.35 3.81
11 11 4.15 4.74
12 12 3.56 3.29
13 13 3.39 5.55
14 14 1.88 2.82
15 15 2.56 4.23
16 16 2.96 3.23
17 17 2.49 2.56
18 18 3.03 4.31
19 19 2.66 4.37
20 20 3.00 2.40
> r = cor(cd4$base, cd4$oneyr)
> r
[1] 0.7231654
费雪变换:
> se = 1/sqrt(17)
> se
[1] 0.2425356
> tanh(c(r-1.6448*se, r+1.6448*se))
[1] 0.3133382 0.8082940
T分布:
> sr = sqrt((1-r^2)/(20-2))
> sr
[1] 0.1627936
> tc = abs(qt(0.05/2, 18))
> c(r-tc*sr, r+tc*sr)
[1] 0.3811486 1.0651821