机器算法验证 - 测试泊松参数时 poisson.test 和 E-test 的区别 - 吾爱随笔录

机器算法验证统计学意义非参数泊松分布

2022-04-10 21:50:45

假设我们有两个独立的泊松分布变量和。我们要测试泊松参数是否相等，即是否。 $X_1$ $X_2$ $\lambda_1=\lambda_2$

现在我们有 4 种不同的统计精确检验可供选择：

E 检验（请参阅 Krishnamoorthy 和 Thomson，比较两个泊松均值的更强大的检验，统计规划和推理杂志119 (2004) 23-35；另请参阅检查两个泊松样本是否在交叉验证中具有相同的均值）
poisson.exact(tsmethod="central")
poisson.exact(tsmethod="minlike")
poisson.exact(tsmethod="balker") （来自exactci R包）

现在，鉴于所有这些测试都被标记为“精确”，人们会期望所有测试都产生相同的 p 值。与此相反，引用的论文清楚地说明了方法 2-4 给出了不同的意义。此外，我亲自实施了E 测试，发现该测试给出了另一个不同的结果。这是为什么？

1个回答

假设检验的 p 值或相应的置信区间取决于对 2 个问题的处理或选择：

1. 干扰参数的处理

为了将大小保持在准确的水平，对于讨厌的参数的所有可能值，类型 1 错误需要小于或等于 alpha。比率相等的原假设不约束值本身，因此它是一个令人讨厌的参数。

条件检验（如精确条件泊松检验或 Fisher 精确检验）通过以汇总统计量为条件来消除干扰参数。

无条件精确测试需要通过对所有可能的讨厌参数值使用 max 或 sup 来断言大小是正确的。Berger-Boos 测试限制了 nuisance 参数的空间，max但添加了一个因素以使其准确，即保留大小 alpha。

从这个意义上说，泊松 E 检验并不是一个精确的检验。它使用“精确”分布，但它使用有害参数的估计值。

2. 两侧拒绝区域的位置

双边测试在下尾和上尾都有拒绝区域。测试的六个最多为 alpha 的要求是对处于其中一个尾部的概率的要求，但它并没有单独确定每个尾部的概率。

“中心”或等尾方法将每个尾的概率限制为小于或等于大小的一半，alpha / 2。

“minlike”使用似然值（基于似然比检验）来寻找非拒绝区域。相应的配置文件置信区间在泊松或二项式等偏态分布中不会有等尾。

Michael P. Fay 指出并强调的一点是假设检验和置信区间通常彼此不一致。

例如，R 中的精确泊松检验使用“minlike”假设检验和精确 p 值，但报告精确的“中心”或等尾置信区间。

在单面测试中，位置是固定的，“minlike”和“central”之间的区别变得无关紧要。因为只有一条尾巴，所以精确测试需要将该尾巴的大小保持在 alpha 级别。

其它你可能感兴趣的问题