我试图理解统计中的“过度分散”是什么意思。
根据维基百科页面,“过度分散”定义如下:“在统计中,过度分散是指数据集中存在比基于给定统计模型预期的更大的可变性(统计分散)。 ”
但是,我听说过对“过度离散”的其他解释,这表明“过度离散是指数据内的方差是均值函数的情况” - 换句话说,均值和方差之间存在非恒定关系数据。
我的问题:有人能告诉我如何在数学上测量和定义“过度分散”吗?例如,我听说正态分布和泊松分布可以定义为“离散模型”。我也听说很多模型都可以被认为是“色散模型”,只要在模型中插入“色散参数”即可。使用这些定义 - 正态分布是“过度分散”的一个例子吗?例如,峰周围的正态分布有更多的变化,而尾部周围的正态分布的变化相对较小。这一切都正确吗?
谢谢!
参考: