机器算法验证 - 最大化可能性与最小化成本 - 吾爱随笔录

我不断遇到两种不同的优化：

我还注意到人们使用梯度方法来解决这两种问题。

为了最大化，梯度更新规则如下所示。直觉是你想要最大化，所以你沿着梯度的方向爬上曲率的小山。

λ_{i + 1} = λ_{i} + \frac{\partial f (x)}{\partial λ_{i}}

$\lambda_{i+1} = \lambda_i + \frac{\partial f(x)}{\partial \lambda_i}$

对于最小化，您希望最小化成本函数，因此您减去梯度以滚下曲率的小山。

λ_{i + 1} = λ_{i} - \frac{\partial f (x)}{\partial λ_{i}}

$\lambda_{i+1} = \lambda_i - \frac{\partial f(x)}{\partial \lambda_i}$

似乎一些优化包要求您翻转最大化问题的符号来获得最小化问题。例子：

请注意，由于minimize仅最小化函数，因此引入符号参数以将目标函数（及其导数）乘以 -1 以执行最大化。

我的第一个想法是最大化对数似然是用于无监督学习（你无法生成成本函数，因为没有标签）——但 CRF 学习也直接最大化对数似然。