测试泊松参数时 poisson.test 和 E-test 的区别

机器算法验证 统计学意义 非参数 泊松分布
2022-04-10 21:50:45

假设我们有两个独立的泊松分布变量我们要测试泊松参数是否相等,即是否X1X2λ1=λ2

现在我们有 4 种不同的统计精确检验可供选择:

  1. E 检验(请参阅 Krishnamoorthy 和 Thomson,比较两个泊松均值的更强大的检验统计规划和推理杂志119 (2004) 23-35;另请参阅检查两个泊松样本是否在交叉验证中具有相同的均值)
  2. poisson.exact(tsmethod="central")
  3. poisson.exact(tsmethod="minlike")
  4. poisson.exact(tsmethod="balker") (来自exactci R包)

现在,鉴于所有这些测试都被标记为“精确”,人们会期望所有测试都产生相同的 p 值。与此相反,引用的论文清楚地说明了方法 2-4 给出了不同的意义。此外,我亲自实施了E 测试,发现该测试给出了另一个不同的结果。这是为什么?

1个回答

假设检验的 p 值或相应的置信区间取决于对 2 个问题的处理或选择:

1. 干扰参数的处理

为了将大小保持在准确的水平,对于讨厌的参数的所有可能值,类型 1 错误需要小于或等于 alpha。比率相等的原假设不约束值本身,因此它是一个令人讨厌的参数。

条件检验(如精确条件泊松检验或 Fisher 精确检验)通过以汇总统计量为条件来消除干扰参数。

无条件精确测试需要通过对所有可能的讨厌参数值使用 max 或 sup 来断言大小是正确的。Berger-Boos 测试限制了 nuisance 参数的空间,max但添加了一个因素以使其准确,即保留大小 alpha。

从这个意义上说,泊松 E 检验并不是一个精确的检验。它使用“精确”分布,但它使用有害参数的估计值。

2. 两侧拒绝区域的位置

双边测试在下尾和上尾都有拒绝区域。测试的六个最多为 alpha 的要求是对处于其中一个尾部的概率的要求,但它并没有单独确定每个尾部的概率。

“中心”或等尾方法将每个尾的概率限制为小于或等于大小的一半,alpha / 2。

“minlike”使用似然值(基于似然比检验)来寻找非拒绝区域。相应的配置文件置信区间在泊松或二项式等偏态分布中不会有等尾。

Michael P. Fay 指出并强调的一点是假设检验和置信区间通常彼此不一致。

例如,R 中的精确泊松检验使用“minlike”假设检验和精确 p 值,但报告精确的“中心”或等尾置信区间。

在单面测试中,位置是固定的,“minlike”和“central”之间的区别变得无关紧要。因为只有一条尾巴,所以精确测试需要将该尾巴的大小保持在 alpha 级别。