当既不满足参数假设又不满足非参数假设时,如何测试组差异?

机器算法验证 假设检验 群体差异 wilcoxon-mann-whitney 检验 非参数
2022-04-04 07:23:29

考虑以下示例。我们问了 50 名男性和 50 名女性一个问题,他们以 5 点李克特量表回答(1 完全不同意,5 完全同意)。假设 50 名男性回答 20 次 1、3 次 2、4 次 3、20 次 4 和 3 次 5,50 名女性回答 15 次 1、15 次 2、15 次 3、2 次 4 和 3 次 5。

我想测试两组的平均(或中位数)答案是否有显着差异。

问题是我既不能使用参数(t检验)也不能使用非参数(Mann-Whitney)检验,因为数据是非正态的(因此t检验不合适),序数因此不是连续的,多峰的,具有不同的方差和不同的形状(因此 Mann-Whitney 检验不合适)。如何检验我的假设?谢谢你的任何回答。

2个回答

你所写的是对这些测试的许多常见误解的汇编。

简短的回答是:使用带有 Welch 校正的 t 检验。现在,细节。

我想测试两组的平均(或中位数)答案是否有显着差异。

均值和中位数是不同的东西。人们通常做的是他们根据平均值而不是中位数来思考,所以默认情况下这也是您应该瞄准的目标。李克特量表是由 Rensis Likert 人发明的,目的是使其对计算手段(不仅仅是中位数)有用。参见 James Carifio、Rocco Perla,“解决关于使用和误用李克特量表的 50 年争论”,医学教育评论,2008 年,Blackwell Publishing Ltd。

问题是我不能使用参数(t检验)和非参数(Mann-Whitney)检验,因为数据是非正态的(因此t检验不合适)(...),多模式(...)

当然不!这两个测试对于分布的形状都是稳健的。只有 Mann-Whitney(通常称为 Wilcoxon-Mann-Whitney 或 WMW 检验)要求两个分布具有相同的形状。

(...) 序数因此不连续 (...)

“序数变量”的意思是“算术手段对它没有意义”。就像以“1 - 文法学校”、“2 - 学院”和“3 - 大学” 3 级量表衡量的教育一样。这并不意味着它不是连续的(尽管通常是这种情况)。

WMW 和 t 检验都不需要连续变量。

(...) 具有不同的方差 (...)

当您使用带有 Welch 校正的 t 检验(Welch BL The generalization of Student's problem when several different population variances are involved, Biometrika, 34, 28-38, 1938)时,您无需担心不等方差(和形状)。t 检验(与任何基于均值的检验一样)在偏离正态性方面已经非常稳健(参见例如 Michael R. Chernick、Robert H. Friis “Introductory Biostatistics for The Health Sciences”、Willey Interscience 2003 和许多其他图书)。这个属性来自一个事实,它是基于手段的。借助中心极限定理,均值分布很快收敛到正态分布。

(...) 并且具有不同的形状(因此 Mann-Whitney 测试不合适)。

是的,你没看错。从技术上讲,Mann-Whitney U 检验不检验中位数,而是检验一个分布是否与另一个分布发生偏移,这是微妙的不同。特别是,它使该测试对组间分布的差异敏感。(参见 Morten W. Fagerland 和 Leiv Sandvik “The Wilcoxon-Mann-Whitney test under scrutiny”,John Willey & Sons,2009)。这些差异可以转化为例如方差或偏度的差异。因此,与 Welch 检验(带有 Welch 修正的 t 检验)相比,此检验在没有方差同质性的情况下是不安全的。

也许你可以使用引导。

你有100分。如果没有显着差异,那么这 100 个点一起代表了整个值的分布。

因此,汇集您的样本,并从该采样空间中抽取(替换)两组 50 个点。测量这两组点的平均值和中位数之间的差异。重复几百次(因为你有一台电脑,所以最多需要几秒钟!)。

现在,测量两个原始样本之间的平均值和中位数的差异。95% 的自举差异是否小于(或大于)此差异?那么你的差异在 95% 的置信水平上是显着的。