在比较两组时选择正确的测试:Mann-Whitney、Kolmogorov-Smirnov 还是其他?

机器算法验证 t检验 kolmogorov-smirnov 测试 wilcoxon-mann-whitney 检验
2022-03-30 07:09:32

我需要帮助,因为我在统计方面的技能和知识非常有限。使用 Pearson 相关性,我发现二进制 1 和取值介于 1 和 4 之间的第二个变量之间存在某种关系。所以现在我想了解二进制变量定义的两组之间是否存在显着差异。

2个变量如下:

X = (0 0 0 0 0 0 0 0 0 0 1 1 1 1)
Y = (4 3 4 3 3 3 3 3 3 3 4 4 4 4)

确定两者之间是否存在显着差异YX=0YX=1,我使用了 Mann-Whitney 测试。这是正确的选择吗?使用KS测试会更好吗?为什么不进行 t 检验?

我正在积极寻找这些问题的答案。

4个回答

我认为 Mann-Whitney/Wilcoxon 排名和检验是合适的检验。KS 测试专门用于比较连续分布 - 您的评级是有序的,因此在这里似乎不合适。

t 检验和 Wilcoxon 排名和的不同之处在于 t 检验比较两个分布的均值,而 Wilcoxon 通过查看两个分布的值在排名时如何比较来比较“位置”。当您的整个评级分布只有两个值时,一组只有 4 的评级并且您的样本量为 14,t 检验对我来说似乎不太合适。它有效,但我只是在概念上更难使用它。该数据比连续数据更具有二项性!

以下是我在R 中完成所有这些操作的方法,R 是一款免费提供的统计计算软件(我认为是使用网站计算测试的一个进步……)

# A vector of data for people with smartphone experience
smartphone <- c(4, 4, 4, 4)

# A vector of data for people without smartphone experience
dumbphone <- c(4, 3, 4, 3, 3, 3, 3, 3, 3, 3)

# The Mann-Whitney/Wilcoxon ranked-sum test
wilcox.test(x = smartphone, y = dumbphone)

# t-test for comparison
t.test(x = smartphone, y = dumbphone)

# And, why not, a test of proportions
# Consider 4 as the event, comparing 4/4 to 2/10
prop.test(x = c(4, 2), n = c(4, 10))

显然,各组之间存在差异-位置完全不同,各组之间没有重叠。即使在这么小的样本量下,任何明智的测试都会拒绝。

我假设你想问一个不同的数据问题。

您应该对智能手机用户和非智能手机用户之间的平均差异进行 t 检验。Pearson 的 R 不适用于二元变量,因为它假设两个变量都是正态分布的(而 X,在您的情况下,不能是因为它是二分的)。

t 检验将询问结果的平均分数(在这种情况下为 Y)在 X 的两个类别中是否存在显着差异。这假设您的 Y 变量适合进行平均。换句话说,它至少应该是具有 5 个左右可能类别的序数(意思是等级排序的类别) ,在技术上需要间隔级别的测量,但实际上,序数是可以的。

有几个可以计算的统计检验和相关系数,您选择的可能是您所拥有的数据类型在您的领域中的任何约定的函数。t 检验在所有领域都很常见,这就是我建议它的原因。

另请注意,t 检验不会为您提供效果大小 - 您正在比较两组在总体中差异为 0 的零假设下的均值。具有统计学意义的发现仅意味着总体中的均值不同。您还可以考虑一些效果大小统计信息 - 这就是 Pearson 的 R 值,但同样不适用于二元变量。

另一种选择是 Pearson 的卡方检验,它适用于分类变量。您可以使用它来测试变量 Y 是否独立于 X,即 Y 是否对 X 有任何影响。但是,您需要一个大于 10 个值的样本,而且我不确定这个测试是否可以与 2x2 列联表一起使用...我似乎记得有最少数量的单元格。