解释置信区间。
置信区间的关键概念是覆盖率、正确性和准确性。
覆盖范围
应首先解释覆盖率或置信水平。它是预期随机间隔包含参数真实值的次数百分比。
最好的展示方式是对关键统计量进行概率陈述,并显示如何反转该陈述以获得置信区间。一个例子可能是获得平均值的置信区间当方差已知为正态分布时. 让样本表示,. 学生将从本科课程中知道或在该特定研究生课程中较早地学习过样本均值均值正常和方差. 那么关键量是
应该清楚的是,如果你多次重复一个实验,每次你观察值,那么在接近 95% 的情况下,区间将包含,当然它也意味着在剩余的大约 5% 的情况下,将位于区间之外。这就是我将如何解释准确的 95% 置信区间。
您当然可以使用其他一些简单的示例,例如估计指数分布的速率参数。这个想法是构建一个其分布已知且独立于任何未知参数的关键量。
为了解释覆盖率和置信度之间的关系,您可以指出,如果您的原始概率语句代替的概率,因此通过在置信区间处方中将替换为 ,您会得到90% 的置信区间。这也说明了降低覆盖率如何收紧区间的宽度。
准确性
其他两个重要的概念 Efron 称之为准确性和正确性。我喜欢使用这个术语。我们查看了精确置信区间的示例。它们是准确的,因为 95% 的标称覆盖率是准确的覆盖率概率。但有时使用渐近理论很方便。趋于无穷大时,它将收敛到该分布。值,宣传的 95% 置信区间的覆盖范围将不准确。但是如果近似值很好,我们可以说近似置信区间是相当准确的。
(这在置信区间的 bootstrap 文献中很重要,因为 bootstrap 置信区间从不准确,并且在某些情况下,某些 bootstrap 变体(例如BCa 方法)给出的区间比其他方法更准确。关于准确性顺序的 bootstrap 理论由 Peter Hall 开发趋于无穷时区间接近广告置信水平的速率来定义准确性。结果涉及使用 Edgeworth 扩展,可以在Hall 的书The Bootstrap and Edgeworth Expansion中找到详细信息。)
正确性
最后,我将讨论正确性。对于许多问题,有几种方法可以构建准确或渐近覆盖率为 95% 的置信区间。我们如何在它们之间进行选择?那么他们会有不同的平均长度。具有最短预期长度的准确置信区间称为正确置信区间,是可供选择的最佳置信区间。当它们存在并且参数的有效估计量存在时,可以通过选择参数的有效估计来构建正确的置信区间。
参数的 95% 置信区间方法:
以这种方式构造的区间将包含概率为 95%。
不要说:有 95% 的概率是在这个区间。每个人都这么说……但请不要。要么在那个特定的区间内,要么不在。
您可能想在 YouTube 上查看“p 值之舞”。p值之舞
这个引人入胜的小视频是关于 p 值的,但是模拟很好地说明了随着实验的复制,样本统计数据如何变化。置信区间的界限是样本统计量。