从有限总体中抽取的样本的无偏方差估计量,无需放回

机器算法验证 数理统计 方差 无偏估计器
2022-03-30 06:23:39

以前,我确实相信S2是一个无偏估计量σ2

S2=1n1i=1n(XiX¯)2

是正确的结论。

但是,我发现了以下声明:

考虑样本方差:

s2=1n1i=1n(yiy¯)2

可以证明(见附录 A,推导)

E(s2)=NN1σ2

这是一个基于简单随机样本的示例,无需替换。它说S2是一个有偏估计量σ2.

所以我想知道“S2是一个无偏估计量σ2” 只能适用于某些特定情况?如何理解基于简单随机样本的这个结果?

3个回答

当从有限总体中无放回抽样时,观测值彼此负相关,样本方差s2=1n1i(xix¯)2是对总体方差的轻微偏差估计σ2.

Robert Serfling在此链接的推导清楚地解释了正在发生的事情。作者首先证明,如果样本中的观测值具有恒定的协方差(即Cov(xi,xj)=γ对所有人ij) 那:

E[s2]=σ2γ

对于独立抽奖(因此γ=0), 你有E[s2]=σ2样本方差是总体方差的无偏估计。但是,有限人口中进行抽样而不进行替换的问题是,您的抽签彼此之间呈负相关!

在从一定规模的总体中进行抽样而不进行替换的情况下N

For ij Cov(xi,xj)=σ2N1
因此:
E[s2]=NN1σ2

对于具有简单随机抽样而无需放回的有限总体,样本方差确实存在偏差。获得无偏结果的解决方案是将样本方差乘以N1N, 在哪里N是人口规模。

我是工程师,不是数学家。所以我的证明是在 Excel 中从有限的人口中建立一个完整的抽样分布,并假设抽样没有替换。我发现抽样分布样本方差的平均值(s2) 不等于总体方差。s2在这种情况下是有偏见的。我不知道为什么文学作品经常忽略这个事实。但如果我乘以平均值s2经过N1N, 在哪里N是人口规模,然后你瞧,乘积正好等于人口方差。

直观地说,随着我的样本大小 n 增加并接近并最终等于总体大小N(n=N),如果样本方差是无偏的,我应该期望样本方差接近总体方差。这不会发生,因为样本除以n1和人口N. 将样本方差乘以N1N解决了这个难题。

我不知道你的陈述来自哪里,但你呈现它们的方式是错误的。直接取样本的方差(即除以n)我们得到一个有偏的估计量,但使用样本方差(除以n1)我们得到一个无偏估计量

我认为您的陈述来自不同的冲突来源,或者您的来源在不同部分使用了不同的符号。也许 ”s2" 表示方差 (n)在一页中和样本方差(n1) 在另一个。一个公式使用“n“其他用途同义”N“让我怀疑它们并不一致。