进入分母的标准偏差也受到离群观察的影响。(它也会影响自由度,因为我们实际上是在这里进行 Welch 测试。)
我们可以检查该附加观察值的变化对 t 统计量的影响:
tinfl <- function(x) t.test(1:10, y = c(7:20, x))$statistic
(或 p 值tinflp <- function(x) t.test(1:10, y = c(7:20, x))$p.value)。
[在 10.18855 附近添加一个观测值会使检验统计量在没有额外观测值的情况下处于何处(9.666492 附近的观测值将 p 值留在原来的位置)。
这称为经验影响函数。这对于查看统计数据如何响应移动数据点很有用。
因此,当我们改变额外的观察结果时,t 统计量的分子、分母和值会发生以下情况:

红色虚线标记了当额外观察出现时发生的情况10(接近需要获得相同测试统计量或与没有观察时相同的 p 值所需的位置)。
当您将额外的观察结果向上移动时,t 统计量变得越来越负(更显着),直到您达到大约 -17.25,然后对标准偏差(以及在某种程度上 df)的影响开始将其拉回.
作为x→∞,检验统计量变为-1。
(限制为x→−∞是 1)
您也可以通过等方差两样本 t 检验看到类似的效果。
t 检验对非常大的异常值不是特别稳健。
如果您有两个过程您对识别位置差异感兴趣,但极少有极端异常值污染(来自一些对您想要与测试进行比较的事物不感兴趣的额外过程),您可以加强 t-测试(通过修改分子和分母的影响函数,使它们都是有界的),或者考虑说一个 Wilcoxon-Mann-Whitney 测试,这样额外观察的效果更像你所期望的。或者您可以考虑进行置换检验(无论是否具有稳健的统计数据)。
这是对 Wilcoxon-Mann-Whitney 检验的影响,以及用于比较的一种特殊形式的鲁棒 t 检验 - 如您所见,Wilcoxon 统计量是单调的,而鲁棒 t 检验仅略微回归。
