我们可以从贝叶斯可信区间得出什么结论?

机器算法验证 假设检验 贝叶斯 p 值 贝叶斯 可信区间
2022-03-30 04:16:26

我了解到可信区间不具有频率属性,但最近我阅读了以下从可信区间/区域派生的陈述:

点 (0,0) 位于关节后密度的 98% 可信区域的边缘线上。总体治疗效果的检验具有显着性,p 值为0.02。

本论文中(第 88 页)和

我们还在图中描绘了上下 2.5% 的后分位数。从这些后验推论,我们可以进一步识别差异表达的蛋白质。例如,如果我们要求高于零的 2.5% 分位数或低于零的 97.5% 分位数,则有 19 个上调蛋白质和 7 个下调蛋白质。

本文中(第 4 节)。

它们合适吗?或者从可信区间得出结论的正确方法是什么?任何输入将不胜感激。

1个回答

置信区间可以等效于假设检验,但最高密度区间与置信区间不同。让我们通过引用 Cohen (1994) 来值是什么p

我们想知道的是“给定这个数据, 为真的概率是多少?” 但正如我们大多数人所知,它值告诉我们的是“鉴于H0pH0是真的,这个(或更极端的)数据的概率是多少?”这些不一样(...)

所以p-value 告诉我们什么是P(D|H0). 在贝叶斯方法中,我们希望在给定数据的情况下直接(而不是间接)学习某些参数的概率P(θ|D)通过采用贝叶斯定理并使用先验θ

P(θ|D)posteriorP(D|θ)likelihood×P(θ)prior

因此,如果 95% 的置信区间不包括零值,那么您可以拒绝您的零假设:您的数据比您预期的假设更为极端。另一方面,如果在贝叶斯设置中,您的 95% 最高密度区间不包括空值,那么您可以得出结论,观察到此类值的概率小于 95%。

可以引用 Kruschke (2010) 来比较这两种方法

NHST [空假设显着性测试] 的主要目标是确定参数的特定“空”值是否可以被拒绝。还可以询问哪些参数值范围不会被拒绝。这个不可拒绝的参数值范围称为置信区间。(...) 置信区间告诉我们一些关于如果我们重复实验可能得到的极端未观察到的数据值的概率 (...)

贝叶斯推理中的一个概念,有点类似于 NHST 置信区间,是最高密度区间 (HDI),(...) 95% HDI 由以下值组成θ至少有一些最小水平的后验可信度,使得所有此类的总概率θ值为 95%。(...) 另一方面,NHST 置信区间与我们想知道的没有直接关系;拒绝价值的概率之间没有明确的关系θ和可信度 θ.

后验概率用于检验假设,但您必须记住,它为不同的问题提供答案p-价值观。

另请参阅:可信区域与贝叶斯假设检验之间有什么联系?为什么 95% 的置信区间 (CI) 并不意味着 95% 的机会包含平均值


科恩,J. (1994)。地球是圆的 (p<.05)。 美国心理学家, 49,997-1003。

克鲁施克,JK(2010 年)。进行贝叶斯数据分析:R 和 BUGS 教程。学术出版社/爱思唯尔。