我有个点的大型数据集,其中每个点包含一个
(year, count)
的一个特定事件。每年有很多计数。查看给定年份的计数直方图,我推测它们遵循泊松分布。通过使用最大似然参数生成泊松分布,。我认为我接下来需要做的是将此预期分布的值与我的归一化直方图进行比较并计算统计量。然而,Wiki 警告说:
在发现期望值 E 很小的情况下(表明潜在的总体概率很小,和/或少量观察),多项分布的正态逼近可能会失败,并且在这种情况下发现更适合使用 G 检验,一种基于似然比的检验统计量。
在更极端的计数值肯定会出现这种情况。如何计算我的数据适合泊松分布的“好”程度?理想情况下,我想要显示一个带有与这个“善良”相关的错误栏