您可以只使用成功次数本身作为测试统计信息。
如果你想要一个单尾测试,这很简单(我希望你会这样做)。对于双尾测试,由于不对称性,通常的方法是将分配给每个尾并以这种方式计算拒绝区域。由于在任一尾部都无法准确地得到 ,因此具体实现方式存在一些差异,但 p 值稍微复杂(您将它们基于您提出的拒绝区域实际情况的任何规则计算)。α/2α/2
1)如果是已知的并且都很小,那么您可以使用泊松近似来计算成功次数。pi
如果 p 都非常小,则总和的均值接近总和的方差,因此快速评估它们是否足够小是将方差与均值进行比较;如果它非常接近,这通常会很好地工作。什么构成“关闭”取决于您的标准,您确实需要自己校准。作为一个非常粗略的经验法则,我建议方差/平均值高于 0.9,但您可能希望它更高。如果你想要一个关于泊松何时起作用的更精确的规则,Le Cam 定理限定了真实概率函数和泊松近似之间的绝对偏差之和(尽管这并不一定告诉你它在确定名义显着性水平准确性的尾部)。
2)如果pi不一定很小,但有很多可以使用正态近似(可能使用连续性校正)。假设 p 通常小于 0.5,一个简单的规则是,如果成功次数的变异系数足够小,则正常近似应该没问题。
* 什么构成“足够”取决于您的标准,同样,您确实需要自己校准。但作为一个非常粗略的经验法则,我建议如果你想要大约 0.05(一个尾)的大致准确的 p 值,变异系数的倒数应该大于 4,如果你想要大致准确的 p 值则大于 5 -值在 2.5% 左右,如果您想要在 1% 左右的合理准确度,则超过 7。但是,这些非常粗糙,您可能希望获得更高的准确性。
3)如果变化很小pi的,你可以使用二项式近似。
4) 可以直接模拟成功次数的分布。
5)伯努利卷积的概率函数(pi) 变量在数值上相当容易计算。对于少量变量(最多几十个),可以通过蛮力轻松完成。[对于较大的数字,您可能最好使用 FFT,因为它更快,尽管您可能会在正常逼近很早之前就达到非常准确的地步。]
在 (1) 到 (3) 的每一种情况下,您都可以通过模拟检查近似的质量……但如果这样做,您不妨以同样的方式获得 p 值。
顺便说一下,R 包poibin提供了四种计算或近似值(它不包括泊松)。有相关论文
Hong, Y. (2012),
“关于计算泊松二项分布的分布函数。”
计算统计和数据分析。
http://dx.doi.org/10.1016/j.csda.2012.10.006。(此处为技术报告)
其中作者基于离散傅里叶变换推导出一个表达式。
这是一个使用泊松近似的示例:
p1,...,p5=0.05,p6,...,p9=0.10
平均值为 0.65,标准差 =0.05×0.95×5+0.10×0.90×4−−−−−−−−−−−−−−−−−−−−−−−−−−√≈0.773
变异系数排除了正态近似。方差除以均值是 0.92,这表明泊松可能不会做得太差。
Poisson(0.65) 的可能(典型范围)单尾显着性水平为 13.8%、2.8%、0.44% ...假设我们选择 2.8%,也就是说,如果我们看到 3 次或更多成功,我们将拒绝空值。
现在,精确的计算只是二项式(5,0.05)和二项式(4,0.10)的卷积,这立即是:
0 1 2 3 4 5 6 7 ...
exact 0.5076777 0.3592339 0.1110464 0.0196723 0.0022006 0.0001612 7.70e-06 2.0e-07
Pois 0.5220458 0.3393298 0.1102822 0.0238945 0.0038829 0.0005048 5.47e-05 5.1e-06
正如你所看到的,它们至少是接近的,除了在远尾(最多 X=3 说);“如果至少有 3 次成功则拒绝”的拒绝规则的确切显着性水平约为 2.2%,而泊松给出的约为 2.8%。出于我的目的,这是合理的,但您自己的需求可能会有所不同。