这是构建置信区间的有效方法吗?

机器算法验证 数理统计 置信区间
2022-03-22 16:02:18

三法则指出,如果我们观察YBin(n,p)为 0,那么[0,3/n]是 95% 的置信区间p. 我对维基百科和其他地方的这条规则的推导感到困惑。

维基百科将找到 95% 的置信区间等同于找到所有p这样Pp(Y=0)0.05. 我正在努力将这一点与我自己的理解相协调,即 95% 的置信区间是一个随机区域C(Y)这样Pp(C(Y) covers p)=0.95对所有人p.

编辑:我意识到我的问题很模糊(我已经删除了对维基百科基本逻辑的错误猜测)。我的主要问题是:维基百科的论点如何合理?我的另一个相关问题是:你如何验证区间的覆盖概率,因为它只定义了一个可能的值Y?

2个回答

Hanley 和 Lippman-Hand (1983) 给出了类似以下的论证,为该规则提供了动机。服用n作为固定,P(X=0|p)=(1p)n.

求解(1p)nα为了p我们得到p1α1n. 最小的p保持概率0不少于α1α1n.

现在α1n=e1nlogα=1+1nlogα+12(1nlogα)2+....

接受我们得到的第一个订单p1nlogα. 什么时候α=0.05,log(0.05)/n3/n.

Jovanovic & Levy (1997) 改进了这一点,更清楚地基于 CI 论证,将其转换为 Clopper-Pearson 区间并获得相同的(1p)n=α界,因此在p

如果X=x是 n 次试验中观察到的事件数,Clopper-Pearson (max-P) 上限(1α)100% 结合可以作为解决方案获得

t=0x(nt)pt(1p)t=α

显然,当x=0表达式简化为(1p)n=α

他们还讨论了其他一些论点。

Hanley, JA 和 Lippman-Hand, A. (1983),
“如果没有任何问题,一切都好吗?解释零分子”
美国医学协会杂志,249(13),1743-1745。

Jovanovic, BD 和 Levy, PS (1997),
“看看三法则”
美国统计学家,51(2),137-139

给定k=0的成功n试验中,准确的 (Clopper-Pearson) 置信区间为[p1,p2]这样

P(Kk=0|p=p1)=α2
P(Kk=0|p=p2)=α2,

在哪里KBinomial(n,p). 你可以计算[p1,p2]使用反二项式函数。但是,也可以手动解决pi因为在这种特殊情况下,累积二项式非常简单:(1p)n=α. 你也可以用同样的方法使用泊松近似来得到enp=α.

这是作为样本量函数的近似值的图表:

在此处输入图像描述