机器算法验证 - 泊松二项分布的假设检验 - 吾爱随笔录

泊松二项分布的假设检验

机器算法验证假设检验统计学意义多重比较泊松二项分布

2022-04-16 05:31:41

想象一下个篮子，每个篮子都装满了从一组中选择的不同数量的产品。在同一个篮子中可能有重复的产品。 $N$ $P$

例如：

basket 1 = [A,B,B,C]
basket 2 = [A,B,C,D,F,J]
basket 3 = [C]
...
basket N = [E,E,E,F,F]

现在我们要求某人从每个篮子中选择一项。例如：

basket 1 = [A,B,B,C] - A
basket 2 = [A,B,C,D,F,J] - A
basket 3 = [C] - C
...
basket N = [A,E,E,E,F,F] - E

我们如何测试这个人对给定产品的偏好？

编辑：

问题可以简化为：

我们有个独立试验，其中每个试验都遵循概率为的伯努利分布。即泊松二项分布。 $N$ $i$ $p_i$

想象一下，我们观察到成功的试验。 $k$

有没有办法计算观察相对于分布的偏差，这种偏差有多大？

（我正在考虑正态分布中的 p 值和 z 分数）

1个回答

您可以只使用成功次数本身作为测试统计信息。

如果你想要一个单尾测试，这很简单（我希望你会这样做）。对于双尾测试，由于不对称性，通常的方法是将分配给每个尾并以这种方式计算拒绝区域。由于在任一尾部都无法准确地得到，因此具体实现方式存在一些差异，但 p 值稍微复杂（您将它们基于您提出的拒绝区域实际情况的任何规则计算）。 $\alpha/2$ $\alpha/2$

1）如果是已知的并且都很小，那么您可以使用泊松近似来计算成功次数。 $p_i$

如果 p 都非常小，则总和的均值接近总和的方差，因此快速评估它们是否足够小是将方差与均值进行比较；如果它非常接近，这通常会很好地工作。什么构成“关闭”取决于您的标准，您确实需要自己校准。作为一个非常粗略的经验法则，我建议方差/平均值高于 0.9，但您可能希望它更高。如果你想要一个关于泊松何时起作用的更精确的规则，Le Cam 定理限定了真实概率函数和泊松近似之间的绝对偏差之和（尽管这并不一定告诉你它在确定名义显着性水平准确性的尾部）。

2）如果 $p_i$ 不一定很小，但有很多可以使用正态近似（可能使用连续性校正）。假设 p 通常小于 0.5，一个简单的规则是，如果成功次数的变异系数足够小，则正常近似应该没问题。

* 什么构成“足够”取决于您的标准，同样，您确实需要自己校准。但作为一个非常粗略的经验法则，我建议如果你想要大约 0.05（一个尾）的大致准确的 p 值，变异系数的倒数应该大于 4，如果你想要大致准确的 p 值则大于 5 -值在 2.5% 左右，如果您想要在 1% 左右的合理准确度，则超过 7。但是，这些非常粗糙，您可能希望获得更高的准确性。

3）如果变化很小 $p_i$ 的，你可以使用二项式近似。

4) 可以直接模拟成功次数的分布。

5）伯努利卷积的概率函数（ $p_i$ ) 变量在数值上相当容易计算。对于少量变量（最多几十个），可以通过蛮力轻松完成。[对于较大的数字，您可能最好使用 FFT，因为它更快，尽管您可能会在正常逼近很早之前就达到非常准确的地步。]

在 (1) 到 (3) 的每一种情况下，您都可以通过模拟检查近似的质量……但如果这样做，您不妨以同样的方式获得 p 值。

顺便说一下，R 包poibin提供了四种计算或近似值（它不包括泊松）。有相关论文

Hong, Y. (2012)，
“关于计算泊松二项分布的分布函数。”
计算统计和数据分析。
http://dx.doi.org/10.1016/j.csda.2012.10.006。（此处为技术报告）

其中作者基于离散傅里叶变换推导出一个表达式。

这是一个使用泊松近似的示例：

$p_1, ..., p_5 = 0.05, p_6, ...,p_9 = 0.10$

平均值为 0.65，标准差 = $\sqrt{0.05\times 0.95\times 5 + 0.10 \times 0.90 \times 4} \approx 0.773$

变异系数排除了正态近似。方差除以均值是 0.92，这表明泊松可能不会做得太差。

Poisson(0.65) 的可能（典型范围）单尾显着性水平为 13.8%、2.8%、0.44% ...假设我们选择 2.8%，也就是说，如果我们看到 3 次或更多成功，我们将拒绝空值。

现在，精确的计算只是二项式（5,0.05）和二项式（4,0.10）的卷积，这立即是：

             0         1         2         3         4         5        6       7 ... 
exact 0.5076777 0.3592339 0.1110464 0.0196723 0.0022006 0.0001612 7.70e-06 2.0e-07  
Pois  0.5220458 0.3393298 0.1102822 0.0238945 0.0038829 0.0005048 5.47e-05 5.1e-06

正如你所看到的，它们至少是接近的，除了在远尾（最多 X=3 说）；“如果至少有 3 次成功则拒绝”的拒绝规则的确切显着性水平约为 2.2%，而泊松给出的约为 2.8%。出于我的目的，这是合理的，但您自己的需求可能会有所不同。

其它你可能感兴趣的问题

上一篇为什么我们不应该沉迷于不偏不倚下一篇R中用于广告和销售数据的数据挖掘技术