机器算法验证 - 将弹性净惩罚应用于逻辑回归背后的数学 - 吾爱随笔录

将弹性净惩罚应用于逻辑回归背后的数学

机器算法验证回归物流弹性网

2022-03-23 12:10:45

我了解 Ridge / Lasso / Elastic Net 回归惩罚如何应用于线性回归的成本函数，但我试图弄清楚它们如何应用于 Logistic 回归的最大似然成本函数。

我试过通过谷歌查看页面，看起来可以做到（我相信 Sci-Kit 的逻辑回归模型接受 L1 和 L2 参数，我看过一些 YouTube 视频说惩罚可以应用于逻辑模型），我发现它们是如何添加到残差平方和成本函数中的，但我很好奇惩罚是如何与最大似然成本函数一起应用的。是最大可能性减去惩罚吗？

2个回答

弹性净项被添加到最大似然成本函数中。即最终成本函数为：

$\sum_{i = 0}^{N}\bigg[- (y\log(p) + (1-y)\log(1-p))\bigg] + \lambda_1 \sum_{i=0}^{k}|w_i| + \lambda_2 \sum_{i=0}^{k}w_i^2$

第一项是似然性，第二项是弹性网络的范数部分，第三项是范数部分。 $l_1$ $l_2$

即，网络试图最小化负对数似然，并试图最小化权重。

是的，惩罚只是简单地添加到成本函数中（负/正取决于您是最小化还是最大化函数）。

您可以将成本函数中的惩罚项（例如似然性成本函数）视为等价于拉格朗日乘数等问题的问题，例如

maximize f (β) subject to g (β) \leq t and h (β) \leq t_{2}

${\text{maximize} f(\beta) \text{ subject to $g(\beta) \leq t$ and $h(\beta) \leq t_2$}}$

\begin{aligned} f (β) & = L (β | x) \\ g (β) & = | | β | |_{1} \\ h (β) & = | | β | |^{2} \end{aligned}

$\begin{align} f(\beta) &= \mathcal{L}(\beta \vert x) \\ g(\beta) &= \vert\vert \beta \vert\vert_1\\ h(\beta) &= \vert\vert \beta \vert\vert^2 \end{align}$

简单来说。您最大化对数似然函数，限制系数的二次范数的大小（相当于岭回归）和范数的（相当于套索）。 $\vert\vert \beta \vert\vert^2$ $l_1$ $\vert\vert \beta \vert\vert_1$

另请参阅弹性网络公式之间的等效性

其它你可能感兴趣的问题

上一篇与 AIC、BIC 和似然检验相比，交叉验证误差是否更具“信息性”？下一篇关于贝叶斯优化、高斯过程和获取函数的理解问题