你所写的是对这些测试的许多常见误解的汇编。
简短的回答是:使用带有 Welch 校正的 t 检验。现在,细节。
我想测试两组的平均(或中位数)答案是否有显着差异。
均值和中位数是不同的东西。人们通常做的是他们根据平均值而不是中位数来思考,所以默认情况下这也是您应该瞄准的目标。李克特量表是由 Rensis Likert 人发明的,目的是使其对计算手段(不仅仅是中位数)有用。参见 James Carifio、Rocco Perla,“解决关于使用和误用李克特量表的 50 年争论”,医学教育评论,2008 年,Blackwell Publishing Ltd。
问题是我不能使用参数(t检验)和非参数(Mann-Whitney)检验,因为数据是非正态的(因此t检验不合适)(...),多模式(...)
当然不!这两个测试对于分布的形状都是稳健的。只有 Mann-Whitney(通常称为 Wilcoxon-Mann-Whitney 或 WMW 检验)要求两个分布具有相同的形状。
(...) 序数因此不连续 (...)
“序数变量”的意思是“算术手段对它没有意义”。就像以“1 - 文法学校”、“2 - 学院”和“3 - 大学” 3 级量表衡量的教育一样。这并不意味着它不是连续的(尽管通常是这种情况)。
WMW 和 t 检验都不需要连续变量。
(...) 具有不同的方差 (...)
当您使用带有 Welch 校正的 t 检验(Welch BL The generalization of Student's problem when several different population variances are involved, Biometrika, 34, 28-38, 1938)时,您无需担心不等方差(和形状)。t 检验(与任何基于均值的检验一样)在偏离正态性方面已经非常稳健(参见例如 Michael R. Chernick、Robert H. Friis “Introductory Biostatistics for The Health Sciences”、Willey Interscience 2003 和许多其他图书)。这个属性来自一个事实,它是基于手段的。借助中心极限定理,均值分布很快收敛到正态分布。
(...) 并且具有不同的形状(因此 Mann-Whitney 测试不合适)。
是的,你没看错。从技术上讲,Mann-Whitney U 检验不检验中位数,而是检验一个分布是否与另一个分布发生偏移,这是微妙的不同。特别是,它使该测试对组间分布的差异敏感。(参见 Morten W. Fagerland 和 Leiv Sandvik “The Wilcoxon-Mann-Whitney test under scrutiny”,John Willey & Sons,2009)。这些差异可以转化为例如方差或偏度的差异。因此,与 Welch 检验(带有 Welch 修正的 t 检验)相比,此检验在没有方差同质性的情况下是不安全的。