两个比例相等的同时 Z 检验(二项分布)

机器算法验证 假设检验 二项分布 部分 z检验
2022-04-01 13:40:47

是否有同时检验两个比例相等时k正在测试二项式属性?

例子:

两组大号n1n2被问及他们是否同意或不同意 10 个不同的问题。对于任何一个特定的问题,你可以做一个Z- 测试比例是否相等,但该比例可能因问题而异。

例如:p1=(.23,.80,.03)p2=(.28,.84,.08)

有没有办法调查比例向量的假设p1p2来自两个种群是否相等?

2个回答

对于您要查找的内容没有简单的测试,因为您必须考虑一个主题内 10 个响应的未知相关性。一些选项,其中许多通常不够充分,包括:

  1. 折叠“至少一个是”的 10 个答案,并使用卡方检验 - 这对于罕见事件可能是合理的

  2. 折叠“是的数量”的 10 个答案并使用 Wilcoxon 的秩和检验——这对于具有相似概率的事件可能是合理的

  3. 用 10 个不同的卡方检验分别测试每个问题,然后针对多个测试进行调整。最简单的选项是 Bonferroni 调整 - 在这种情况下,将所有 p 值乘以 10(测试次数)。更好的方法是对最大测试统计量(或最小 p 值)进行基于重采样的测试。

  4. 使用适当的广义估计方程模型 (GEE)。您可以通过多种方式进行设置,具体取决于您愿意假设的内容。

  5. 我认为您可以使用一些聚类测试进行调查,但设置起来也不是很简单。

也许分层对数线性模型会起作用。将您的数据想象为 2 x 10 x 2 数组:第一个维度是同意/不同意;第二个维度包含问题,第三个维度索引两组。您可以拟合一系列模型,直到找到合适的模型。因此

  1. 仅在边缘条件。这始终假定独立。在 R 中,调用将是 loglin(x, list(1,2,3))。
  2. 边缘条件以及答案和问题之间的关系。loglin(x, list(c(1,2),3)。这允许问题之间的关系,并允许两组中的不同数字。
  3. 然后拟合完整模型 loglin(x, list(c(1,2,3))。

如果两组的行为方式相同,则模型 2 将不显着。如果不是,那么就不是——你需要模型 3,这意味着组不同。

正如@Aniko 所指出的,这并不能解释问题嵌套在主题中的事实,但是对数线性模型接受它获得的响应模式并尝试在两组之间对其进行建模。如果各组之间的反应方式存在明显差异,则该测试应将它们选中。

另一种可能性是在组和替代之间没有差异的零假设下写下可能性。然后进行似然比检验。如果您准备忽略问题之间的相关性,则可能性将是多项分布的可能性。

如果您担心问题之间的相关性,您可能希望使用具有分类预测变量的潜在变量模型,并使用 SEM 分析查看组之间的差异。为此,您需要大量数据以及潜在变量模型的合理理由。