解释置信区间。

机器算法验证 解释 置信区间
2022-03-31 11:36:58

如果有人要求我解释置信区间(比如在统计学的第一门研究生课程的水平)——是否有用于这种解释的典型模板。

通过典型模板,我的意思是这样的(如果您有更好的说法,请随时编辑):

上述区间:

  1. 在 [[Something]] 和 [[Something]] 之间具有 Some-property
  2. 对 [[Some-property]] 敏感
  3. ……

[[ 和 ]] 之间的字符串可以用值、概念、参数等替换。

另一种说法可能是:在您继续逐案解释之前,是否有一个关于置信区间的检查清单需要解释。

提前致谢。

注意:在这个网站上有一些关于解释置信区间的有趣问题,比如:这里这里这里——但我无法回答这个问题。

2个回答

置信区间的关键概念是覆盖率正确性准确性

覆盖范围

应首先解释覆盖率或置信水平它是预期随机间隔包含参数真实值的次数百分比。

最好的展示方式是对关键统计量进行概率陈述,并显示如何反转该陈述以获得置信区间。一个例子可能是获得平均值的置信区间μ当方差已知为正态分布时1. 让样本表示Xi,i=1,2,,n. 学生将从本科课程中知道或在该特定研究生课程中较早地学习过样本均值Xb=Xi/n均值正常μ和方差1/n. 那么关键量是

Z=n(Xbμ)
Z有个N(0,1)分配。所以当然Pr(|Z|1.96)=0.95(来自标准正态分布表)。您进行反演以表明此概率与相同。那么随机区间 的 95% 置信区间的规定Pr(Xb1.96/nμXb+1.96/n)[Xb1.96/n,Xb+1.96/n]μ

应该清楚的是,如果你多次重复一个实验,每次你观察值,那么在接近 95% 的情况下,区间将包含,当然它也意味着在剩余的大约 5% 的情况下,将位于区间之外。这就是我将如何解释准确的 95% 置信区间。nN(μ,1)μμ

您当然可以使用其他一些简单的示例,例如估计指数分布的速率参数。这个想法是构建一个其分布已知且独立于任何未知参数的关键量。

为了解释覆盖率和置信度之间的关系,您可以指出,如果您的原始概率语句代替的概率,因此通过在置信区间处方中将替换为 ,您会得到90% 的置信区间。这也说明了降低覆盖率如何收紧区间的宽度。1.6451.96Z0.901.961.645

准确性

其他两个重要的概念 Efron 称之为准确性和正确性。我喜欢使用这个术语。我们查看了精确置信区间的示例。它们是准确的,因为 95% 的标称覆盖率是准确的覆盖率概率。但有时使用渐近理论很方便。趋于无穷大时,它将收敛到该分布。值,宣传的 95% 置信区间的覆盖范围将不准确但是如果近似值很好,我们可以说近似置信区间是相当准确的。nn

(这在置信区间的 bootstrap 文献中很重要,因为 bootstrap 置信区间从不准确,并且在某些情况下,某些 bootstrap 变体(例如BCa 方法)给出的区间比其他方法更准确。关于准确性顺序的 bootstrap 理论由 Peter Hall 开发趋于无穷时区间接近广告置信水平的速率来定义准确性。结果涉及使用 Edgeworth 扩展,可以在Hall 的书The Bootstrap and Edgeworth Expansion中找到详细信息。)n

正确性

最后,我将讨论正确性对于许多问题,有几种方法可以构建准确或渐近覆盖率为 95% 的置信区间。我们如何在它们之间进行选择?那么他们会有不同的平均长度。具有最短预期长度的准确置信区间称为正确置信区间,是可供选择的最佳置信区间。当它们存在并且参数的有效估计量存在时,可以通过选择参数的有效估计来构建正确的置信区间。

参数的 95% 置信区间μ方法:

以这种方式构造的区间将包含μ概率为 95%。

不要说:有 95% 的概率μ是在这个区间。每个人都这么说……但请不要。μ要么在那个特定的区间内,要么不在。

您可能想在 YouTube 上查看“p 值之舞”。p值之舞

这个引人入胜的小视频是关于 p 值的,但是模拟很好地说明了随着实验的复制,样本统计数据如何变化。置信区间的界限是样本统计量。