首先让我指出,您似乎对p-values的含义有一个普遍的误解。在传统的(常客)统计分析中,如果空值是真实值,则 p 值是获得与建议的空值一样远或更远的样本统计量(例如样本均值)的概率。重要的是,没有“香蕉治愈癌症的概率至少为 99.99%”之类的东西。p 值可能的事实在很大程度上并不意味着备择假设为真的概率为 99.99%(或零假设为真的概率为 0.01%)。有关此主题的更多信息,阅读此 CV 线程可能会对您有所帮助:<0.0001统计检验中p值和t值是什么意思?
话虽如此,可以断言与贝叶斯框架内的零假设相关的(主观)概率。 贝叶斯规则是:
)一些数据等于数据相对于原假设的独特性(由 RHS 上的商索引)乘以您在看到相关数据之前相信原假设为真的概率。为了使这更容易,请考虑以下示例1:
Pr(H0|D)=Pr(D|H0)Pr(D)Pr(H0)
乳腺摄影
某女性月刊的记者想写一篇关于乳腺癌的文章。作为她研究的一部分,她专注于将乳房 X 线摄影作为乳腺癌的指标。她想知道如果女性在常规乳房 X 光检查中检测出乳腺癌呈阳性,这究竟意味着什么。她有以下数据:
接受乳房 X 光检查的女性患乳腺癌的概率为 1%。
如果接受乳房 X 光检查的女性患有乳腺癌,她检测呈阳性的概率为 80%。
如果接受乳房 X 光检查的女性没有患乳腺癌,她检测呈阳性的概率为 10%。
接受过乳房 X 光检查的女性如果检测呈阳性,实际患乳腺癌的概率是多少?
我们怎样才能算出这个概率呢?我们必须根据检测结果呈阳性的新信息,修改接受乳房 X 光检查的女性患乳腺癌的先验概率 p(cancer),根据文本是 1% 或 p=.01。也就是说,我们正在寻找 p(cancer|positive) 的条件概率。乳腺癌阳性结果的概率 p(positive|cancer) 为 80% 或 p=.8,而没有乳腺癌的阳性结果概率 p(positive|nocancer) 为 10% 或p=.1。
因此,我们有:
0.075数据的可能概率,而只是所有单个枚举概率的总和。为了更清楚起见,我在这里对它们进行了注释。通常,可能概率的集合很难确定。在实践中,人们经常忽略替换等号,“与”成比例。)
Pr(cancer|positive)=0.800.80×0.01Pr(D) w/ cancer+0.10×0.99Pr(D) w/o cancer0.01=0.075
Pr(D)∝
现在在这个例子中,癌症发病率是预先知道的。为了使这个示例更像您的新研究发现示例,让我们假设没有人确切知道癌症发病率是多少,但两位不同的医生认为癌症发病率分别为 1% 和 5%。如果我们在上面的等式中使用后一个值,我们得到:
现在的概率是 29.6%,和上面的 7.5% 差别很大。那么谁是对的呢?我们真的不知道,但重要的是,两位医生都理性地相信他们(非常不同的)他们的患者患有乳腺癌的概率。
Pr(cancer|positive)=0.800.80×0.05+0.10×0.950.05=0.296
换句话说,合理的不是每个人相信的概率,而是他们根据新证据改变信念的方式。 由于两位医生都通过正确应用贝叶斯规则改变了他们的信念,因此他们都是理性的,尽管他们得出了不同的结论。他们最终没有得到相同概率的原因是因为他们事先不相信相同的概率;这就是@AlecosPapadopoulos 所说的“他们没有“相同的信息””。
1. 此示例复制自:Sedlmeier,改进统计推理,第 8-9 页。