多个独立数据集小样本情况下正态性假设的有效性

机器算法验证 t检验 正态假设 假设 小样本
2022-04-07 13:54:26

由于实验设置的限制,我只有 n=3 的小数据集。尽管 df 低,但处理和控制之间的差异大到足以产生显着的 p 值。

问题在于,在样本量较小的情况下,进行 t 检验对数据来自正态分布总体的假设变得更加敏感。然而,在我的情况下,多个独立实验始终产生类似的结果。

由于数据差异很小,我无法对实验数据进行分组。例如,在一个实验中处理和控制之间的增加略大于另一个实验,这可能是由于实验条件的微小差异造成的(进一步解释这一点需要技术性)。尽管如此,始终观察到相同的增加,并且每次 3 个数据点对两组都有一个小的标准偏差。

所以我的问题是,基于多个小样本独立实验的数据做出正态性假设是否站得住脚?如果不正确,在这种情况下使用任何统计数据都不合适吗?

3个回答

这可能会有所帮助:

考克斯博士,PJ 所罗门。1986. 大量小样本的变异性分析。生物计量学 73:543-554。

摘要:讨论了分布形式的详细分析程序,基于许多大小为 r 的样本,其中特别是 r=2、3、4。讨论了区分不同类型偏离标准正态假设的可能性。一些关于脉搏率的数据开发和说明了图形和更正式的程序。

由于实验设置的限制,我只有 n=3 的小数据集。尽管 df 低,但处理和控制之间的差异大到足以产生显着的 p 值。

问题在于,在样本量较小的情况下,进行 t 检验对数据来自正态分布总体的假设变得更加敏感。然而,在我的情况下,多个独立实验始终产生类似的结果。

由于数据差异很小,我无法对实验数据进行分组。

如果您将实验视为块,则可以用来解释这一点。(或者,您可能希望在截距上使用随机效应项,尤其是在不受控制的情况下。)

所以我的问题是,基于多个小样本独立实验的数据做出正态性假设是否站得住脚?

如果您假设一个共同的误差分布并结合所有实验中的残差,您可以尝试评估它,以便说一个正态 QQ 图(正态分数图)。

如果不正确,在这种情况下使用任何统计数据都不合适吗?

您仍然可以在没有正态性的情况下检验您的假设,但请注意,使用非参数检验和如此小的样本量,您不会得到非常显着的结果。

但是,组合实验策略(使用块)也可以在那里工作。

当然还有其他统计数据。例如,您可以进行置换测试。您还可以进行非参数检验,例如 Wilcoxon。