为什么卡方分布的均值等于自由度?

机器算法验证 意思是 期望值 自由程度 卡方分布
2022-03-28 16:33:28

这是卡方分布定义的一部分吗?

还是从另一个属性推导出来的?在这种情况下,证据是什么?

2个回答

您没有将均值定义为自由度 (df) - 它遵循 pdf 的定义和随机变量的期望定义。

卡方随机变量的 pdfkdf 是:

12k2Γ(k2)xk21ex2x>0,k>0 (和0别处)

连续随机变量的期望为:

E[X]=xf(x)dx.

所以卡方随机变量的均值是:

E[X]=0x12k2Γ(k2)xk21ex2dx

拉出常数并结合x权力

12k2Γ(k2)0xk+221ex2dx

积分中的项可以被识别为另一个卡方(缺少归一化常数)。如果您乘以相关的归一化常数并除以使积分为 1,那么您会在前面留下一个归一化常数的比率(对于不同的 df)......您应该能够简化它。


但是,如果您的问题真的是“为什么选择将该 pdf 称为卡方?”,whuber 的评论是相关的 - 独立标准法线的平方和是一个随机变量,在许多情况下相当自然地出现* ,就是我们想要命名的东西。自由度与所涉及的独立法线的数量有关,每个平方分量的平均值为 1。

* 例如,Helmert将其识别为与来自正态分布的 iid 样本的样本方差分布有关(尽管使用了符号χ2因此直到皮尔逊大约一代人的工作才出现“卡方”这个名字)。

卡方分布是带参数的 Gamma 分布(λ,α)=(12,n2).

我们知道 Gamma 的期望值为αλ.

因此,卡方 rv 的期望值为n/21/2=n.