在我看来,抽样分布是统计 101 的关键思想。你不妨跳过这门课程,就像跳过那个问题一样。然而,我很熟悉这样一个事实,学生就是不明白,似乎不管你做什么。我有一系列的策略。这些可能会占用大量时间,但我建议跳过/缩写其他主题,以确保他们了解抽样分布。以下是一些提示:  
- 说清楚:  我首先明确提到我们关心的 3 个不同的分布:总体分布、样本分布和抽样分布。我在整个课程中一遍又一遍地说,然后在整个课程中一遍又一遍。每次我说这些术语时,我都强调独特的结尾:样本,抽样。(是的,学生们确实厌倦了这一点;他们也明白了这个概念。)  
 
- 使用图片(数字):  我有一套标准的数字,我每次谈论这个时都会使用。它具有清晰描绘的三个分布,并且通常标记。(该图附带的标签在 powerpoint 幻灯片上并包含简短描述,因此它们不会显示在此处,但显然它是:顶部的人口,然后是样本,然后是抽样分布。)

 
- 给学生活动:  你第一次介绍这个概念时,要么带上一卷镍币(有些四分之一可能会消失),要么带上一堆 6 面骰子。让学生分成小组,生成一组 10 个值并取平均值。然后您可以在板上或使用 Excel 制作直方图。  
 
- 使用动画(模拟):  我在 R 中编写了一些(可笑的低效)代码来生成数据并在实际中显示它。当您过渡到解释中心极限定理时,这部分特别有用。(注意这些
Sys.sleep()陈述,这些停顿让我有时间解释每个阶段发生的事情。)   
N = 10
number_of_samples = 1000
iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  
windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  
for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  
  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  
  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  
  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  
Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  
txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
- 在整个学期中重新实例化这些概念:  每次我们谈论下一个主题时,我都会再次提出抽样分布的想法(尽管通常只是非常简短)。最重要的地方是当您教授 ANOVA 时,作为零假设情况,确实存在您从同一总体分布中多次抽样的情况,并且您的组均值实际上是经验抽样分布。(有关此示例,请在此处查看我的答案:标准错误如何工作?。)