虽然要求对数据进行更深入的调查通常看起来是明智的,但作者忽略了削弱他们论证的重要事实。我将在他们提供的说明性示例中展示这些事实。
1)第一个是关于孩子的性别和健康状况与“悲伤”(关于孩子的死亡?)的可能相互作用。这是 - 就像在心理测量学中一样 - 以序数而非公制量表测量。因此,不允许计算悲伤的差异。(到底应该怎么办?你悲伤地跪在地上多远?)这就消除了作者论证的一个主要要求,即通过采取不同的手段将效果分解为相互作用和主要效果(也不适用于序数分析)。最后,对于这样的顺序布局,实际上只能说“健康男性>健康女性>患病女性>患病男性”。
这与在此类环境中“交互”一词的重要性以及作者和他们批评的人的另一个缺陷相结合。也就是说,证明序数交互作用显着的唯一方法是 X 形交互作用图。(如论文中的图 1 所示)。为什么?2×2
假设像第一个示例中一样的“<”形交互图(表 1)。作为悲伤量表上差异的大小,您可以选择使 3 接近 1 和 -1 接近 -3 的单调变换。这不会破坏数据中的基本信息内容。但是现在你几乎有一个“=”形的交互图,并且会得出结论(即使是从方差分析,这无论如何都不适合序数数据;应该在那里使用非参数程序)没有交互。
因此,序数交互将是“健康的男性 >= 生病的女性 > 健康的女性 >= 生病的男性”。这种 X 形模式不能通过单调地重新调整“悲伤”的(任意)序数缩放来破坏。
2)关于第二个例子,有一个完全不同的缺陷。
这个例子考虑了一些度量,即棒球运动员的击球次数,他们受到可能的交互条件的影响。现在可以计算命中差异,并允许分解为主效应和交互效应。但它是独一无二的吗?2×2
我们永远无法分辨。考虑表 6:
a0 a1
b0 b1 b0 b1
group mean 3 3 5 7
row effect -1.5 -1.5 1.5 1.5
column effect -0.5 0.5 -0.5 0.5
grand mean 4.5
interaction +0.5 -0.5 -0.5 +0.5
是什么让作者相信 -1.5 是a0和 1.5的行效应的无偏估计a1?他们选择这些值类似于最小二乘估计,但 LSE 只能估计期望值。它不能告诉我们如何将未知参数分解成更未知的加法。
我们对这些未知的命令很感兴趣!如果两个单元格值完全相同,a0b0为什么会有 +/-0.5 的列效应?a0b1这是因为其他细胞。这意味着,由于完全不同的棒球运动员,即那些处于条件状态的球员a1,我们得出结论,如果我们将 a0 组的一名球员视为条件b1而不是b0,他每场比赛会再击球一次吗?虽然在组中条件和已观察到a0之间没有差异?这是真的吗?或者它只是一个统计海市蜃楼?b1b0
Rao(1962)发现了这种现象的统计背景,称为可估计性。可以看出,在这个包含所有四种交互效果的简单布局中,主效果是不可估计的,这意味着它们依赖于任意东西。这导致了这个海市蜃楼。2×2
只有当我们从模型中删除交互作用时,主效应估计量才会变得唯一。因此,Rosnow 和 Rosenthal 想要比较根本不存在的术语。
这个错误也导致了一个错误的结论,即重要的相互作用总是 X 形的。
但它们并非完全错误:如果您在 ANOVA 中没有发现显着的交互作用,并且想开始仅考虑主效应,则应该记住可能发生了 II 型错误,并且事实上存在使主效应的估计和检验产生偏差的交互作用。因此,具有置信区间的交互图将是一个好主意,因为它还可以更清楚地说明影响本身。