在这种情况下如何进行假设检验?

机器算法验证 r 假设检验 威尔克森符号秩
2022-04-04 04:32:49

已经提出了一种新的方法来教授本科生的英语。这种方法(我们称之为 X)已经在一组 27 名学生中进行了测试。最初,负责这门课程的讲师确信,如果应用这种方法 X,超过 50% 的课堂将不及格。

学生获得的最终成绩为(最低及格分数为 55):

60,25,45,0,90,35,0,70,5,70,0,0,65,55,55,40,50,65,65,30,0,70,0,50,5,50,20

我在 R 中编写了以下程序来检查我的数据是否是正态分布的:

data=c(60,25,45,0,90,35,0,70,5,70,0,0,65,55,55,40,50,65,65,30,0,70,0,50,5,50,20)
length(data)
summary(data)
d=density(data)
boxplot(data)
plot(d)
qqnorm(data)
qqline(data)
hist(data,breaks=length(data),xlim=c(0,100),ylim=c(0,10),freq=TRUE)

对于获得的图表,我可以看到我的数据不是正态分布的,所以我决定应用非参数检验,特别是 Wilcoxon 检验,看看是否假设超过 50% 的学生会在课程失败的情况下失败应用方法;代码是:

wilcox.test(data,alternative="less",mu=50,conf.int=TRUE)

我将 mu 的值视为假设的中值,我得到的结果如下:

Wilcoxon signed rank test with continuity correction

data:  data
V = 81.5, p-value = 0.02565
alternative hypothesis: true location is less than 50
95 percent confidence interval:
     -Inf 47.49996
sample estimates:
(pseudo)median 
      34.99995 

Warning messages:
1: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
  cannot compute exact p-value with ties
2: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
  cannot compute exact confidence interval with ties
3: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
  cannot compute exact p-value with zeroes
4: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
  cannot compute exact confidence interval with zeroes

据我所知,这意味着平均值与假设值 50 显着不同。那么我是否设法证明这种新方法的应用使超过一半的班级未能通过课程?如果我所有的分析都是错误的,有人可以指导我如何证明新方法的应用对大量课程失败且不是随机的学生产生了影响?请考虑到我以前没有接受过统计学教育。

PD。另一个教室的另一位讲师被提示使用这种新方法 X,和她一起上课的学生人数大约有 30 人,但她使用的是 OLD 方法;课程失败的学生数量非常少。不幸的是,由于行政负担,我无法收集有关每个学生分数的详细信息。

2个回答

您只有一个样本,因此当您调用 时wilcox.test,这不是在执行 Wilcoxon-Mann-Whitney,而是在执行(正如它在输出中告诉您的那样!) Wilcoxon符号秩检验

在我看来,这与所讨论的假设没有直接关系。如果有额外的假设(不成立),它可能是相关的,但我认为这不是一个合适的测试。

沿着符号秩检验的思路,您可以进行符号检验……但这与我之前在评论中建议的二项式比例检验相同。


回复评论中的后续问题:

数字等级的比较可以通过

  1. 两个样本 t 检验(可能具有未合并的方差和对 df 的 Welch-Satterthwaite 调整)。

    虽然分布有些偏斜和离散,但样本量足够大,t 分布将是一个合理的近似值。

  2. 或者,可以使用 Wilcoxon-Mann-Whitney 检验,只要由于离散性而适当考虑数据中的联系水平。

  3. 最后,可以使用基于任何感兴趣的统计数据比较的置换检验;实际上,前面提到的两个统计数据中的任何一个都可以用作置换检验的基础(由此自动处理偏度和离散性问题)。

根据您的数据,27 人中有 17 人的分数低于 55,因此失败。这是 63%,95% 的置信区间为 42.3% 至 80.6%。因此,这种教学方法超过 50% 会失败的假设仍未得到证实(置信区间超过 50% 意味着真实率可能低于 50%)。