在阅读时,我遇到了一个令人费解的说法,即样本均值和方差仅在对称分布中不相关,如果分布严重偏斜,则存在很强的相关性。
首先,这是真的吗?我已经知道这适用于正常人口的情况,但是可以证明每个对称分布吗?尽管我认为结果是违反直觉的,但我会很欣赏简单的论点。
谢谢
在阅读时,我遇到了一个令人费解的说法,即样本均值和方差仅在对称分布中不相关,如果分布严重偏斜,则存在很强的相关性。
首先,这是真的吗?我已经知道这适用于正常人口的情况,但是可以证明每个对称分布吗?尽管我认为结果是违反直觉的,但我会很欣赏简单的论点。
谢谢
评论太长了:
如果分布是对称的,则样本均值和方差始终独立是不正确的。例如,从一个取值的分布中抽取样本等概率:如果样本均值是那么样本方差将是, 而如果样本均值不是那么样本方差将为正。
如果分布是对称的,则样本均值和方差的分布确实具有零相关性(如果它们具有相关性)。这是因为通过对称。
这两点都没有涉及书中的陈述,它只说 if而不是if。
以最后陈述的一个例子为例,如果一个分布的大部分是紧密聚集的,但偶尔会有非常大的值,那么样本均值将很大程度上取决于样本中非常大的值的数量,并且更多它们存在,样本方差也越高,导致高相关性。