成本函数 - Log Loss 查询

数据挖掘 逻辑回归 损失函数 成本函数
2022-02-14 22:34:20

在逻辑回归成本函数“log loss”中使用“log”的目的是什么?

1个回答

让我们探索二进制分类的用例。在二元分类中,标签来自伯努利分布。对于每个示例,伯努利分布的可能性是

py(1p)(1y).

我们希望最大化整个数据集的可能性,这意味着我们希望最大化所有示例的乘积。

因为我们希望它对优化器方便,所以我们做了两件事:

  1. 我们想要一个最小化问题,所以我们最小化负似然而不是最大化似然。 
  2. 我们从乘积转换为和(这更容易得到导数)为了做到这一点,我们应用对数变换,它是单调变换,它向我们保证最佳参数将保持不变,即最小化对数似然等效于最小化可能性。 

对数损失是负对数似然。以单个示例的日志为例,我们得到:

yilog(pi)+(1yi)log(1pi).

对数损失只是所有示例的负总和。