已经提出了一种新的方法来教授本科生的英语。这种方法(我们称之为 X)已经在一组 27 名学生中进行了测试。最初,负责这门课程的讲师确信,如果应用这种方法 X,超过 50% 的课堂将不及格。
学生获得的最终成绩为(最低及格分数为 55):
60,25,45,0,90,35,0,70,5,70,0,0,65,55,55,40,50,65,65,30,0,70,0,50,5,50,20
我在 R 中编写了以下程序来检查我的数据是否是正态分布的:
data=c(60,25,45,0,90,35,0,70,5,70,0,0,65,55,55,40,50,65,65,30,0,70,0,50,5,50,20)
length(data)
summary(data)
d=density(data)
boxplot(data)
plot(d)
qqnorm(data)
qqline(data)
hist(data,breaks=length(data),xlim=c(0,100),ylim=c(0,10),freq=TRUE)
对于获得的图表,我可以看到我的数据不是正态分布的,所以我决定应用非参数检验,特别是 Wilcoxon 检验,看看是否假设超过 50% 的学生会在课程失败的情况下失败应用方法;代码是:
wilcox.test(data,alternative="less",mu=50,conf.int=TRUE)
我将 mu 的值视为假设的中值,我得到的结果如下:
Wilcoxon signed rank test with continuity correction
data: data
V = 81.5, p-value = 0.02565
alternative hypothesis: true location is less than 50
95 percent confidence interval:
-Inf 47.49996
sample estimates:
(pseudo)median
34.99995
Warning messages:
1: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
cannot compute exact p-value with ties
2: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
cannot compute exact confidence interval with ties
3: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
cannot compute exact p-value with zeroes
4: In wilcox.test.default(data, alternative = "less", mu = 50, conf.int = TRUE) :
cannot compute exact confidence interval with zeroes
据我所知,这意味着平均值与假设值 50 显着不同。那么我是否设法证明这种新方法的应用使超过一半的班级未能通过课程?如果我所有的分析都是错误的,有人可以指导我如何证明新方法的应用对大量课程失败且不是随机的学生产生了影响?请考虑到我以前没有接受过统计学教育。
PD。另一个教室的另一位讲师被提示使用这种新方法 X,和她一起上课的学生人数大约有 30 人,但她使用的是 OLD 方法;课程失败的学生数量非常少。不幸的是,由于行政负担,我无法收集有关每个学生分数的详细信息。