在解释阶乘 ANOVA 中的交互作用时,是否有必要查看剩余单元均值?

机器算法验证 方差分析 相互作用 解释
2022-04-22 05:24:00

Rosnow 和 Rosenthal在他们 1989 年的论文“交互效应的定义和解释”中写道:

当以因子排列声明交互时,结果几乎总是需要比我们的主要期刊中通常报告的更详细的分析。在报告交互作用时,研究心理学家已经养成了只检查原始单元均值(简单效应)之间的差异的习惯,而不是在去除低阶效应后更恰当地检查残差或剩余效应。

然后在同一篇文章中:

本文的重点是强调,如果调查人员声称要谈论相互作用,那么查看校正的单元格(或条件)手段的练习是绝对必要的。

这是真的吗?为什么/为什么不?

我问这个问题的原因是因为在我看来,尽管这篇文章是在 25 年前发表的,但在我看来,人们普遍仍以 Rosnow 和 Rosenthal 所谴责的方式来解释互动。

那是因为坏习惯一直存在吗?还是罗斯诺和罗森塔尔一开始就错了?

2个回答

这不会是一个完整的答案,但我会说几件事。

我怀疑任何说某某“绝对必要”的建议。虽然查看交互效果是帮助理解交互的一种方式,但在某些情况下,它不是唯一可能的方式,也不是最好的方式。

我也倾向于打折不包含“图表”一词或其同义词的建议。我们做统计是因为我们想了解数据中发生了什么。一个过度关注统计数据、值和残余效应的人正在看着树木,而可能没有欣赏森林。我认为一个交互图——或十几个,取决于情况的复杂性——几乎总是理解交互的一个很好的开始。即使在交互检验显着的情况下,看起来像交互的交互图也提供了一个非常强烈的信息,表明数据不足以识别它。FtPF

所以我对这个问题的一般回答是尝试真正理解正在发生的事情,并使用任何可能的方法来实现这种理解。

虽然要求对数据进行更深入的调查通常看起来是明智的,但作者忽略了削弱他们论证的重要事实。我将在他们提供的说明性示例中展示这些事实。

1)第一个是关于孩子的性别和健康状况与“悲伤”(关于孩子的死亡?)的可能相互作用。这是 - 就像在心理测量学中一样 - 以序数而非公制量表测量。因此,不允许计算悲伤的差异。(到底应该怎么办?你悲伤地跪在地上多远?)这就消除了作者论证的一个主要要求,即通过采取不同的手段将效果分解为相互作用和主要效果(也不适用于序数分析)。最后,对于这样的顺序布局,实际上只能说“健康男性>健康女性>患病女性>患病男性”。

这与在此类环境中“交互”一词的重要性以及作者和他们批评的人的另一个缺陷相结合。也就是说,证明序数交互作用显着的唯一方法是 X 形交互作用图。(如论文中的图 1 所示)。为什么?2×2

假设像第一个示例中一样的“<”形交互图(表 1)。作为悲伤量表上差异的大小,您可以选择使 3 接近 1 和 -1 接近 -3 的单调变换。这不会破坏数据中的基本信息内容。但是现在你几乎有一个“=”形的交互图,并且会得出结论(即使是从方差分析,这无论如何都不适合序数数据;应该在那里使用非参数程序)没有交互。

因此,序数交互将是“健康的男性 >= 生病的女性 > 健康的女性 >= 生病的男性”。这种 X 形模式不能通过单调地重新调整“悲伤”的(任意)序数缩放来破坏。

2)关于第二个例子,有一个完全不同的缺陷。

这个例子考虑了一些度量,即棒球运动员的击球次数,他们受到可能的交互条件的影响。现在可以计算命中差异,并允许分解为主效应和交互效应。但它是独一无二的吗?2×2

我们永远无法分辨。考虑表 6:

                       a0               a1
                   b0      b1       b0      b1  
group mean          3       3        5       7 
row effect       -1.5    -1.5      1.5     1.5   
column effect    -0.5     0.5     -0.5     0.5   
grand mean                     4.5
interaction      +0.5    -0.5     -0.5    +0.5  

是什么让作者相信 -1.5 是a0和 1.5的行效应的无偏估计a1他们选择这些值类似于最小二乘估计,但 LSE 只能估计期望值。它不能告诉我们如何将未知参数分解成更未知的加法。

我们对这些未知的命令很感兴趣!如果两个单元格值完全相同,a0b0为什么会有 +/-0.5 的列效应?a0b1这是因为其他细胞。这意味着,由于完全不同的棒球运动员,即那些处于条件状态的球员a1,我们得出结论,如果我们将 a0 组的一名球员视为条件b1而不是b0,他每场比赛会再击球一次吗?虽然在组中条件已观察到a0之间没有差异?这是真的吗?或者它只是一个统计海市蜃楼?b1b0

Rao(1962)发现了这种现象的统计背景,称为可估计性可以看出,在这个包含所有四种交互效果的简单布局中,主效果是不可估计的,这意味着它们依赖于任意东西。这导致了这个海市蜃楼。2×2

只有当我们从模型中删除交互作用时,主效应估计量才会变得唯一。因此,Rosnow 和 Rosenthal 想要比较根本不存在的术语。

这个错误也导致了一个错误的结论,即重要的相互作用总是 X 形的。

但它们并非完全错误:如果您在 ANOVA 中没有发现显着的交互作用,并且想开始仅考虑主效应,则应该记住可能发生了 II 型错误,并且事实上存在使主效应的估计和检验产生偏差的交互作用。因此,具有置信区间的交互图将是一个好主意,因为它还可以更清楚地说明影响本身。