在神经网络中,梯度下降用于寻找成本函数的最优最小值。为什么这种偏好而不是寻找利润函数的最大值?
最小化成本函数与最大化利润函数的优缺点是什么?
在神经网络中,梯度下降用于寻找成本函数的最优最小值。为什么这种偏好而不是寻找利润函数的最大值?
最小化成本函数与最大化利润函数的优缺点是什么?
两者之间不一定有区别,但我们最小化成本函数而不是最大化利润函数的最重要原因是优化方法。神经网络使用梯度下降进行优化,其中我们使用成本函数的导数来计算梯度并使用梯度来调整参数。假设您将使用精度作为利润函数,它是不可微的,这意味着您无法计算导数,因此无法使用梯度下降(或者在这种情况下,梯度上升,因为我们想要最大化函数)。然后,我们指定一个可微的成本函数,并将其最小化,因为成本函数通常会随着利润函数的增加而下降。