Fisher 精确检验是“参数”还是“非参数”?

机器算法验证 非参数 列联表 渔民精确测试
2022-03-20 03:31:25

我不清楚我们是否可以将 Fisher 精确检验视为“参数”或“非参数”检验。我的直觉是它应该被定义为“参数”,因为它涉及完全指定的分布(超几何)。但是,如果是这样,我将无法找到 2x2 列联表的非参数检验示例,这让我想知道这种区别在这种情况下是否有用。

4个回答

tl; dr:Fisher 精确检验是非参数的,因为它不假设总体基于理论概率分布(正态/几何/指数等),但数据本身反映了参数,这就是它进行的原因假设行/列总数是固定的。

顾名思义,Fisher 的精确检验给出了精确的p 值,而不是基于被认为与变量对齐的特定抽样分布的估计。

如果您有两个或多个变量,都是分类/名义的,并且您的数据由独立的观察组成,那么您已经可以直观地创建一个交叉表来评估条件频率(类似于您希望在维恩图中看到重叠的方式) . 例如,假设您的自变量是性别(M/F/O),因变量是党的忠诚度(D/R/I)。

现在假设我们不知道任一变量的概率分布,这意味着我们不能只将数据插入任何参数测试。(在经典 FET 中,它只有一个 2x2(两个二分变量),你知道它是二项分布的,你可以继续使用超几何分布来估计 p 值。)

费舍尔的精确检验直接为我们提供了找到与我们所拥有的结果一样极端的结果的概率。换句话说,它反映了我们观察到的频率与预期频率的距离。如果性别真的与党员无关,那么应该是大致均匀的分布。(旁白:您可以在此处使用 1 个样本 KS 测试来测试均匀分布。)

但是费舍尔的检验采用所有离散值 <= 观察到的值,计算它们的概率,并将它们相加得到 p 值,然后将其与 alpha 进行比较(I 型错误的概率,即错误地拒绝 null性别与党员身份之间没有关联的假设)。

注意,尽管当样本量较小时,FET 被用作交叉表卡方检验的方法,但 FET 有自己的假设——我只会将它用于 MECE 组织的数据,这样变量“真的” ' 名义上的基本意义,而不是为简单起见而设计(例如,如果我们使用通常的定义,生物性别是“真正的”名义上的,而“治疗状态”绝不能被视为真正的名义变量)以及个体实例在哪里独立记录。

有关 FET 在数学上的实际严格概念,请查看 Weisstein 的简洁定义 - http://mathworld.wolfram.com/FisersExactTest.html

Fisher 精确检验是一种参数检验,因为它确实假设表的基本二项式分布。然后以精确的方式根据成功的总数计算表格概率。术语参数是指是否对数据如何产生进行分布假设,而不是说是否计算了检验统计量然后与某些分布(例如正态、t、等)进行比较。2×2χ2

考虑比较两个二分观察样本(“成功”和“失败”)的情况,并采用以下方法之一来定义检验统计量及其抽样分布:

(1) 假设,在原假设下,所有观测值都是独立于相同分布和阶数统计量的条件得出的(对于原假设下的分布足够)。确定第一个样本(或任何等效样本)中的“成功”计数在您感兴趣的备选方案的方向上衡量与 null 的差异。

(2) 假设每个样本中的观测值构成独立的伯努利随机变量。总体优势比是感兴趣的参数,而“成功”的总体优势是令人讨厌的参数;每个样本中“成功”的计数是共同充分的,并构成二项式随机变量。以“成功”总数为条件,这对于讨厌的参数是足够的,对于感兴趣的参数几乎是辅助的。

到目前为止,无论您在设计测试时是否一直在回避 (1) 或接受 (2) 参数假设,您都处于相同的位置:在第一个样本中的“成功”计数遵循零下的超几何分布。(把想要进行双尾检验可能产生的任何微妙的考虑放在一边。)对于只能取两个值的观察,单独的独立同分布假设需要在调节后在零下对分布进行完全参数化.

用于非参数数据的测试可以用于任何正常或不正常的数据(只是与只能用于正常数据的测试相比,它们不太可靠)。Fishers 检验是当数据太小时,实际上比卡方更喜欢使用的检验之一。