什么是“方差分析”?

机器算法验证 方差分析 定义
2022-04-03 06:14:12

维基百科说:

方差分析 (ANOVA) 是一组统计模型,用于分析组均值及其相关程序之间的差异(例如组间和组间的“变异”)。在 ANOVA 设置中,特定变量中观察到的方差被划分为可归因于不同变异源的分量。

单向或双向方差分析,(这是我见过的方差分析的类型),输入变量X是分类的,其值代表样本的组。

统计学习的要素:数据挖掘、推理和预测中。作者 Trevor Hastie、Robert Tibshirani 和 Jerome Friedman,ANOVA 似乎是一种建模方式E(Y|X)作为不同数量的组件的函数的总和X. 它与方差或将方差划分为某种形式无关。X也不一定是分类的,可能是连续的。还是我错过了什么?谢谢!

在此处输入图像描述

2个回答

单向和双向 ANOVA 只是两个简单的版本,但我怀疑该主题的两位专家是否会完全同意 ANOVA 的核心,以适度或极端的普遍性对待。

有关证据,请参见 Speed, TP 1987。什么是方差分析? 统计年鉴15:885-910。随后进行了 11 次讨论,作者进行了反驳,将其四舍五入。

ANOVA是一种技术,而不是模型

一些消息来源将方差分析称为“模型”或“模型集合”,但在我看来这是不正确的。首字母缩略词ANOVA指的是“方差分析”,它是一种统计技术,可以应用于各种统计模型,而不是模型本身。ANOVA 的本质在于使用适用于回归模型的迭代方差(或其他方差分解)定律。考虑同方差回归模型的一般形式:

Yi=u(Xi,β)+εiE(εi)=0V(εi)=σ2.

并将迭代方差定律应用于这个一般模型给出:v(β)V[u(Xi,β)]

V(Yi)=V[E(Yi|Xi)]+E[V(Yi|Xi)]=V[u(Xi,β)]+E[σ2]=v(β)+σ2.

现在,数据通常允许您估计响应变量和误差项的方差,从而得出估计值:

v^(β)=σ^Y2σ^2.

的任何假设值都会给出方差项 的已知值,这意味着您可以通过查看隐含方差是否接近估计值来测试假设值的合理性方差。这就是您如何在回归模型中使用 ANOVA 检验来检验上的假设。βv(β)β