我需要帮助以非常基本的外行术语理解 ANCOVA 的概念。另外,有人能解释一下 ANOVA 与 ANCOVA 的不同之处吗:似乎这两种技术都用于比较两个不同组的平均值?
我如何用基本的外行术语理解 ANCOVA?
为了回答您的问题,我想请您考虑一个更广泛的图景,然后带您回到最初的问题。
首先,我想介绍一个带有一个分类自变量的ANOVA和线性回归之间的比较;其次,我想介绍一个分类自变量和一个定量自变量的ANCOVA和线性回归的比较;然后,我想介绍一下 ANCOVA 和 ANOVA 之间的比较。
假设,为了说明起见,您有三组个体(具有三个水平的分类自变量)和一组关于每个个体的定量附加信息(定量自变量),当然,超出了他们的个体反应。
您可以使用 ANOVA 来评估这三个组是否具有相同的平均响应,给定一组假设,我们不会出于教学原因在这里关注这些假设。
您可以使用相同的数据运行具有 2 个虚拟变量的线性回归,一个用于指示个人是否属于第二组,另一个用于指示个人是否属于第三组。通过排除,既不属于第二组也不属于第三组的个人将属于第一组,可以将其视为“参考组”。
您将使用该回归来评估第二组和第三组的平均响应与第一组的差异有多大(给定一组假设等)。
可以证明这两种表述在数学上是等价的,因此区别在于语义领域。
除了统计技术细节,这两种分析在解释方面有什么区别?
首先,主要关注的是检测所有组是否具有相同的平均值。在第二组中,主要关注的是检测第二组和第三组与第一组的差异有多大,扫除关于第二组和第三组之间差异的讨论。
仅就解释而言:土豆/potahto?也许。
现在看看 ANCOVA。除了小组的平均反应之外,您还考虑可能会或可能不会影响个人预期反应的定量附加信息。
考虑到定量信息的额外影响,ANCOVA 与 ANOVA 一样,将专注于检测组是否具有相同的平均响应。具有上述两个虚拟变量加上一个定量回归量的线性回归将集中在评估该定量回归量对预期个体反应的影响。
同样,可以证明这两个公式之间存在数学等价性。
现在,在解释方面可能有什么不同?在回归中,您实际上对评估定量回归器的效果感兴趣,而在 ANCOVA 中,您只想在比较组间的平均响应之前打折定量回归器的效果,因为您根本不在乎该定量回归变量是否与个人反应无关。
因此,您的兴趣是通过将一些可变性计入源(该当定量回归量)来减少比较中未解释的可变性。
在回归中,如果回归量的影响在统计上不显着,则将其从模型中排除并仅使用您的虚拟变量再次调整它。在 ANCOVA 中,您甚至不需要测试定量回归量的显着性,因为无论显着与否,它已经发挥了控制个体反应中无法解释的变异性、群体影响之外以及归因于系统变异性的作用该定量回归器的影响。
最后,针对您的问题,ANCOVA 控制了您可以归因于特定来源的系统变异性,从而减少了在残差平方和中捕获的无法解释的非系统变异性,而 ANOVA 则没有。
好样的?=)
ANOVA 着眼于一个或多个分组变量(因素)对某些连续相关测量的影响。
ANCOVA 包括至少一个分组变量,但也包括 IV 侧的区间或比率标度变量,这些变量假定与回归中的 DV 以线性方式相关。
ANOVA 将让我评估性别(分组变量)和出生国家(分组变量)的组合的外向性分数 (DV) 是否不同。
ANCOVA 将让我评估不同性别(群体)和不同年龄(比例变量)的人的外向性得分 (DV) 是否不同——尽管这两个变量的相互作用通常未被检查。