数据挖掘 - 成本函数 - Log Loss 查询 - 吾爱随笔录

数据挖掘逻辑回归损失函数成本函数

2022-02-14 22:34:20

在逻辑回归成本函数“log loss”中使用“log”的目的是什么？

1个回答

让我们探索二进制分类的用例。在二元分类中，标签来自伯努利分布。对于每个示例，伯努利分布的可能性是

$p^y*(1-p)^{(1-y)}$ .

我们希望最大化整个数据集的可能性，这意味着我们希望最大化所有示例的乘积。

因为我们希望它对优化器方便，所以我们做了两件事：

对数损失是负对数似然。以单个示例的日志为例，我们得到：

$y_i \log(p_i) + (1-y_i) \log (1-p_i)$ .

对数损失只是所有示例的负总和。

其它你可能感兴趣的问题