我最近才使用学生 t 检验来检查两个样本的值是否具有相同的平均值。我想知道贝叶斯统计中是否有一种互补技术可以做类似的事情。
特别是我想知道我因此获得的值(http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)。在我的两个样本中样本大小为 2 时,我认为如果我添加更多测量值或移除一些测量值,所得的 p 值可能会波动很大。
我最近才使用学生 t 检验来检查两个样本的值是否具有相同的平均值。我想知道贝叶斯统计中是否有一种互补技术可以做类似的事情。
特别是我想知道我因此获得的值(http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)。在我的两个样本中样本大小为 2 时,我认为如果我添加更多测量值或移除一些测量值,所得的 p 值可能会波动很大。
想到了两个。
Morey 和 Rouder 提出了“接受和拒绝零假设的贝叶斯 t 检验”。参考文件在这里,有一个方便的Web 界面和一个R 包。也有用于 ANOVA 和相关性的等效程序。
John Kruschke 声称“贝叶斯估计取代了 t 检验”(“BEST”)。参考文件在这里,Rasmus Bååth 的网络应用程序在这里,当然还有一个R 包。有关更多信息,请参阅网页,包括 Python 实现。Rasmus Bååth 在这一传统中实施了一系列进一步的测试,但也提供了一个非常易读的 BEST 解释。
BEST 和 Rouder/Morey 检验这两者之间的主要区别在于,Morey 和 Rouder 在假设检验的传统中明确提出了他们的方法,而 BEST 是参数估计。在引擎盖下,两者并没有太大的不同——默认先验、MCMC 采样——但结果却大不相同;第一个为您提供支持或反对您的假设的贝叶斯因子,另一个将图形表示集中在估计参数的可信区间上。