什么是 F 检验?

机器算法验证 假设检验 统计学意义 方差分析 f检验
2022-04-12 05:51:02

什么是 F 检验,它显示了什么?还有什么是 alpha,我如何评估 p 值?

1个回答

什么是 F 检验,它显示什么?

术语“F 检验”可以表示其在原假设下的抽样分布具有 F 分布的任何检验。有几个完全不同的测试。

这里有几个比较常见的:

(i) 多组均值相等的 F 检验(也称为 ANOVA,ANalysis Of Variance 的缩写,因为均值的不平等往往会导致两个不同的方差估计不同)。如果您拒绝原值,则您得出的结论是样本均值相距太远,无法通过具有相等总体均值的随机变化来解释;另一种解释是总体均值不相等。对于此检验,较大的 F 值会导致您拒绝原假设。

有相关的检验,例如回归的整体 F 检验和部分 F 检验。ANOVA 中的 F 检验可以看作是回归的一种特殊情况。

该测试假设正常,但对轻微偏差并不特别敏感。

(ii) 方差相等性检验。如果您拒绝原值,则您得出的结论是样本方差差异太大,无法用等方差的随机变异来解释;另一种解释是总体方差不相等。

该测试**假设正常,并且对该假设非常敏感。我建议不要使用它,除非在非常有限的情况下。您不太可能处于这种情况。

** (实际上,有几个这样的测试,但我主要指的是方差相等性的方差比测试;现在更多地使用 Levene 测试或 Brown-Forsythe 测试,严格的正态性假设不再是问题)

在这个答案中有关于这两个测试的额外讨论(包括一些希望有用的图表)

还有什么是阿尔法?

它是选择的类型 I 错误率在您进行测试之前(实际上是在您查看数据之前,最好是在您收集任何数据之前),您选择拒绝真实的零假设的机会。也称为显着性水平。

阅读更多关于假设检验一般如何工作的信息可能会有所帮助。例如,请参阅 Wikipedia 关于重要性在假设检验I 型和 II 型错误中的作用。

更一般地说,它是类型 I 错误率的选定上限,因为在复合零假设下,您不会只有一个。

...以及如何评估 p 值?

这取决于您的意思是“我如何计算它们?” 或“我如何解释它们?”

如果你的意思是第一个:

计算涉及查看测试统计数据的

(偏离测试统计的值,您希望看到零假设是否正确,而您希望看到它是否为假)

计算是通过计算来自零分布的“随机”检验统计量至少与计算的样本检验统计量一样不寻常的概率来完成的。

[零分布是当零假设为真时检验统计量所采用的分布(F 检验的 F 分布),这里更不寻常意味着更接近您期望看到的备择假设是否为真。]

因此,对于 ANOVA,当备选方案为真(总体均值不同)时,F 统计量往往会更大,并且您计算在 null 时看到的值至少与观察到的(样本)F 一样大的概率是真的。也就是说,找到上尾的概率,至少与观察值一样大。

在实践中,人们要么查表,要么现在更常见的是,使用计算机程序来查找尾部概率。

如果它非常小,那么要么原假设为真,但发生的概率非常低,要么原假设不正确(并且没有必要认为任何特别不可能发生的事情)。对于足够低的 p 值,第一个位置变得站不住脚;你拒绝原假设。是什么让它足够低?小于显着性水平,α

如果您指的是第二个,那么阅读更多关于p 值是什么的信息可能会有所帮助。我们有很多关于 p 值解释的好帖子。以下是一些您可能会以某种方式找到帮助的方法:

如何解释方差分析中的 F 值和 p 值?

“p值”的确切值没有意义吗?

大p值是什么意思?

误解了 P 值?

p值和置信区间之间有什么关系?

人们可以在多大程度上解释 p 值(超出或低于)是一个有点争议的问题。更严格地属于 Neyman-Pearson 脉络的人倾向于说你不应该这样做,而采取更费舍尔方法的人(我没有真正讨论过这个区别)往往很乐意这样做。我们在实践中实际看到的通常是两者的混合,不是完全舒服的安排。α