为什么样本均值不是一个好的(足够的)统计数据?

机器算法验证 自习
2022-03-20 22:26:10

考虑一个简单的例子,上是 iid 均匀分布通过大数的强低,我可以得出结论 但是,目前还不清楚的 pdf 或 cdf 是什么因为我必须做一个维积分才能将 cdf 设为应该是一个很好的统计数据似乎是“直观的” 。但是练习者很快就会知道真正的充分统计量是,并且通过分解定理证明这一点并不困难。Xi[θ,θ+1]

X¯Pθ+12
X¯nFX¯(t)=P(Xi<nt,θXi<θ+1)X¯(X(1),X(n))

我决定在课后问教授这件事。他告诉我不够接近,作为统计学家,必须考虑现实生活中的应用。但是这个解释没有说服力,因为我可以使用来达到同样的目的。我想问一下对于这个例子来说是否真的是一个糟糕的统计数据,如果是,是什么原因。另外我想知道是否是一个足够的统计数据。X¯θX¯12X¯X¯

1个回答

充分性与数据缩减有关,而不是估计本身这是一个需要理解的重要区别。是的,“好的”估计量通常是充分统计量的函数,但这并不意味着所有充分统计量都是估计量。

至于你的具体例子,一个简单的方法来理解为什么X¯不是一个充分的统计数据θ是考虑以下实验:假设我告诉你X¯=10. 这是否等同于有关的所有信息θ我们可以从样本中得到什么?当然不是:例如,X1=9.5,X2=10.4,X3=10.1可以给我们10, 但也可以X1=X2=9.75,X3=10.5. 如果你只有知识X¯,你丢失了关于θ在原始样本中可用:即,在第一种情况下,我们必须有θ[9.4,9.5],在第二个中,θ[9.5,9.75]. 请注意,这些间隔几乎是不相交的。这就是为什么X¯是不够的θ. 你也许可以用它来估计θ什么时候n很大,但正如我所指出的,充分性与数据减少有关,而不是估计。