机器学习中的有效参数是什么意思

机器算法验证 机器学习 自由程度 超参数
2022-04-22 05:12:22

我的问题可能有点模棱两可,但我开始想知道机器学习中的“有效参数”是什么意思?我在我的大学里很少听到机器学习教授谈论有效参数(上下文是关于 k 最近邻或高斯混合模型等)。

任何澄清这可能意味着什么?感谢您的任何帮助!

PS 我也在书中看到了这个术语:统计学习的要素第 2版,Trevor Hastie,第 15 页。

2个回答

一些模型(这里:线性回归)有参数β

y^=i{1..p}βixi+β0

对于相同数量的输入特征,更复杂的模型(这里:基扩展到二次模型)具有更多参数:

y^=i,j{1..p}ijβijxixj+i{1..p}βixi+β0

一般来说,具有更多参数的模型更灵活(因为要调整更多参数以使模型适应数据),但更难以拟合,因此更容易过度拟合。正则化通过降低调整的自由度来帮助克服这些问题,从而稍微降低复杂性:

y^=i,j{1..p}ijβijxixj+i{1..p}βixi+β0, withβ2 small

我们可以用“有效参数”来表达“模型复杂性”或“调整自由度”:对于您研究的模型,找到具有相同调整自由度的基于参数的模型(没有正则化) . 该模型的参数数量是模型的有效参数数量。

这种概括还可以进一步扩展到不基于参数的模型(例如 k 最近邻)。然后复杂度被称为Vapnik-Chervonenkis (VC) 维度方便地,对于(非正则化的)线性回归,它是,参数的实际数量。 Elements of Statistical Learning,第 7.9 节,提供了更多相关信息(他们似乎或多或少地互换使用术语“VC”、“有效参数数量”和“模型复杂性”)。p+1

“有效参数”也可以称为“有效自由度”。在线性模型中,我们注意到杠杆——拟合值随实际值的变化量——可以相加以获得模型的自由度。然后可以将这种计算自由度的方法应用于非线性模型。y^iyi

例如,假设您的“模型”是取个最近邻居的平均值。对于每个观测值,拟合值是值的平均值。观察本身将在这个最近点之间,它自己的贡献将是,因此每个观察的杠杆是,对于观察,有效自由度是kkkyi/k1/knn/k