机器算法验证 - 在解释阶乘 ANOVA 中的交互作用时，是否有必要查看剩余单元均值？ - 吾爱随笔录

在解释阶乘 ANOVA 中的交互作用时，是否有必要查看剩余单元均值？

机器算法验证方差分析相互作用解释

2022-04-22 05:24:00

Rosnow 和 Rosenthal在他们 1989 年的论文“交互效应的定义和解释”中写道：

当以因子排列声明交互时，结果几乎总是需要比我们的主要期刊中通常报告的更详细的分析。在报告交互作用时，研究心理学家已经养成了只检查原始单元均值（简单效应）之间的差异的习惯，而不是在去除低阶效应后更恰当地检查残差或剩余效应。

然后在同一篇文章中：

本文的重点是强调，如果调查人员声称要谈论相互作用，那么查看校正的单元格（或条件）手段的练习是绝对必要的。

这是真的吗？为什么/为什么不？

我问这个问题的原因是因为在我看来，尽管这篇文章是在 25 年前发表的，但在我看来，人们普遍仍以 Rosnow 和 Rosenthal 所谴责的方式来解释互动。

那是因为坏习惯一直存在吗？还是罗斯诺和罗森塔尔一开始就错了？

2个回答

这不会是一个完整的答案，但我会说几件事。

我怀疑任何说某某“绝对必要”的建议。虽然查看交互效果是帮助理解交互的一种方式，但在某些情况下，它不是唯一可能的方式，也不是最好的方式。

我也倾向于打折不包含“图表”一词或其同义词的建议。我们做统计是因为我们想了解数据中发生了什么。一个过度关注和统计数据、值和残余效应的人正在看着树木，而可能没有欣赏森林。我认为一个交互图——或十几个，取决于情况的复杂性——几乎总是理解交互的一个很好的开始。即使在交互检验不显着的情况下，看起来像交互的交互图也提供了一个非常强烈的信息，表明数据不足以识别它。 $F$ $t$ $P$ $F$

所以我对这个问题的一般回答是尝试真正理解正在发生的事情，并使用任何可能的方法来实现这种理解。

虽然要求对数据进行更深入的调查通常看起来是明智的，但作者忽略了削弱他们论证的重要事实。我将在他们提供的说明性示例中展示这些事实。

1）第一个是关于孩子的性别和健康状况与“悲伤”（关于孩子的死亡？）的可能相互作用。这是 - 就像在心理测量学中一样 - 以序数而非公制量表测量。因此，不允许计算悲伤的差异。（到底应该怎么办？你悲伤地跪在地上多远？）这就消除了作者论证的一个主要要求，即通过采取不同的手段将效果分解为相互作用和主要效果（也不适用于序数分析）。最后，对于这样的顺序布局，实际上只能说“健康男性>健康女性>患病女性>患病男性”。

这与在此类环境中“交互”一词的重要性以及作者和他们批评的人的另一个缺陷相结合。也就是说，证明序数交互作用显着的唯一方法是 X 形交互作用图。（如论文中的图 1 所示）。为什么？ $2\times 2$

假设像第一个示例中一样的“<”形交互图（表 1）。作为悲伤量表上差异的大小，您可以选择使 3 接近 1 和 -1 接近 -3 的单调变换。这不会破坏数据中的基本信息内容。但是现在你几乎有一个“=”形的交互图，并且会得出结论（即使是从方差分析，这无论如何都不适合序数数据；应该在那里使用非参数程序）没有交互。

因此，序数交互将是“健康的男性 >= 生病的女性 > 健康的女性 >= 生病的男性”。这种 X 形模式不能通过单调地重新调整“悲伤”的（任意）序数缩放来破坏。

2）关于第二个例子，有一个完全不同的缺陷。

这个例子考虑了一些度量，即棒球运动员的击球次数，他们受到可能的交互条件的影响。现在可以计算命中差异，并允许分解为主效应和交互效应。但它是独一无二的吗？ $2\times 2$

我们永远无法分辨。考虑表 6：

                       a0               a1
                   b0      b1       b0      b1  
group mean          3       3        5       7 
row effect       -1.5    -1.5      1.5     1.5   
column effect    -0.5     0.5     -0.5     0.5   
grand mean                     4.5
interaction      +0.5    -0.5     -0.5    +0.5

是什么让作者相信 -1.5 是a0和 1.5的行效应的无偏估计a1？他们选择这些值类似于最小二乘估计，但 LSE 只能估计期望值。它不能告诉我们如何将未知参数分解成更未知的加法。

我们对这些未知的命令很感兴趣！如果两个单元格值完全相同，a0b0为什么会有 +/-0.5 的列效应？a0b1这是因为其他细胞。这意味着，由于完全不同的棒球运动员，即那些处于条件状态的球员a1，我们得出结论，如果我们将 a0 组的一名球员视为条件b1而不是b0，他每场比赛会再击球一次吗？虽然在组中条件和已观察到a0之间没有差异？这是真的吗？或者它只是一个统计海市蜃楼？b1b0

Rao（1962）发现了这种现象的统计背景，称为可估计性。可以看出，在这个包含所有四种交互效果的简单布局中，主效果是不可估计的，这意味着它们依赖于任意东西。这导致了这个海市蜃楼。 $2\times2$

只有当我们从模型中删除交互作用时，主效应估计量才会变得唯一。因此，Rosnow 和 Rosenthal 想要比较根本不存在的术语。

这个错误也导致了一个错误的结论，即重要的相互作用总是 X 形的。

但它们并非完全错误：如果您在 ANOVA 中没有发现显着的交互作用，并且想开始仅考虑主效应，则应该记住可能发生了 II 型错误，并且事实上存在使主效应的估计和检验产生偏差的交互作用。因此，具有置信区间的交互图将是一个好主意，因为它还可以更清楚地说明影响本身。

其它你可能感兴趣的问题

上一篇综合控制法下一篇袋装随机森林的含义？