如果中位数相等,如何解释 Mann-Whitney 的统计显着性?

机器算法验证 统计学意义 非参数 群体差异 wilcoxon-mann-whitney 检验
2022-03-23 04:10:52

使用 Mann-Whitney 检验测试两组观察值之间的差异,得到以下输出(来自 minitab):

                N  Median
positives  137  1.0000
negatives  892  1.0000
Point estimate for η1 - η2 is 0.0000
99.0 Percent CI for η1 - η2 is (0.0001,-0.0001)
W = 56899.5
Test of η1 = η2 vs η1 ≠ η2 is significant at 0.0000
The test is significant at 0.0000 (adjusted for ties)

当我测试其他组对时,我得出的结论是,如果测试显示出统计学上的显着差异,那么根据他们的中位数,一个组往往比另一组具有更大的值。但是,上面的示例表明我可能没有正确解释结果。

以下是上述示例的一些附加描述性统计信息:

Variable   |  Mean | StDev  | Minimum | Q1 |Median| Q3 | Maximum
positives  |  4.13 | 13.17  |  1.00   |1.00| 1.00 |1.00| 116.00
negatives  | 6.851 | 20.503 |  0.000  |1.00| 1.00 |5.00| 434.000
  • 我做错了什么?
  • 我怎样才能弄清楚差异的方向?例如,我是否可以得出结论,基于它们较大的 Q3,底片往往具有较大的值?
2个回答

Mann-Whitney 不是对中位数的检验。充其量,Mann-Whitney 检验只能声称是对两个总体汇总排名之间平均排名差异的检验。

如果您需要对中位数进行测试,您可以轻松地根据经验计算中位数并执行基本的 Wald 测试。

仅当基础分布是对称的时,Mann-Whitney 检验恰好是对中位数的相当强大的检验,这些数据中明显违反了这一假设。但是,如果分布是对称的,则中位数也恰好是均值(当方差有限时)。这意味着 Mann-Whitney 和 t 检验在对称分布中检验相同的假设。

Mann-Whitney U 检验是一种秩和检验,因此它并不真正关心分布属性,例如均值、媒体等,它只关心您的一个变量往往具有比另一个更高的值,因此前者具有更高的等级总和。不过,如果您仔细查看此表:

Variable   |  Mean | StDev  | Minimum | Q1 |Median| Q3 | Maximum
positives  |  4.13 | 13.17  |  1.00   |1.00| 1.00 |1.00| 116.00
negatives  | 6.851 | 20.503 |  0.000  |1.00| 1.00 |5.00| 434.000

您可能会注意到,这两个变量的 25 百分位数、均值和中位数相等,而秒数的 75 百分位数更高。这支持了第二个分布可能具有更高秩和的观察结果。

编辑

受到 AdamO 评论的启发,我对 U-test 进行了一些研究。根据Arthritis and Rheumatism 杂志(影响因子 >7)上发表的回复,测试只能比较两种形状相似的分布。这个假设显然被违反了。

Mann-Whitney U 检验 (2) 和 Kruskal-Wallis 检验 (3) 是非参数方法,旨在检测 2 个或更多样本是否来自同一分布,或检验比较组之间的中位数是否不同,假设基础分布的形状是相同的。因此,这些非参数检验通常用于确定比较组之间的中位数(而非均值)是否不同。尽管这些检验通常用于在不违反正态性假设时比较均值,但严格来说,解释均值比较的非参数检验结果是不准确的。当变量的分布出现偏差时(例如,如 van der Helm-van Mil 等人在他们文章的表 2 中给出的 C 反应蛋白的值)1),只有关于中位数是否不同的断言,而不是平均值,组之间的差异应该使用非参数方法进行。

鉴于您的样本不小,我建议您尝试排列测试来回答您的问题。是关于它们的局限性的一个很好的讨论