偏差和方差如何与机器学习中的训练/测试误差相关。用外行的话来说,高方差是否意味着高测试错误

数据挖掘 机器学习 分类 线性回归 强化学习 方差
2022-02-14 21:08:35

是什么导致高偏差/方差以及后果是什么。有人可以简单地解释一下训练/测试错误吗?谢谢

1个回答

大多数 ML 模型试图优化的偏差和方差权衡。

偏差:在训练集上学习的高偏差分类器的表达能力不足以解释所提供的数据。在这种情况下,训练误差和测试误差都会很高,因为分类器没有考虑训练集中存在的相关信息。

Variance:在训练集上学习的分类器过于具体,不能用于准确推断未见数据的任何内容。尽管随着时间的推移训练误差继续减少,但随着分类器开始根据仅存在于训练集中而不存在于更广泛分布中的模式做出决策,测试误差将再次开始增加。

请参阅下图了解更多详情:

在此处输入图像描述