Logistic 回归中的误差计算

数据挖掘 逻辑回归
2022-02-21 13:26:54

假设我们有一个预测商品价格的线性回归模型。如果项目的预测是 8 美元,实际价值是 10 美元,那么很明显错误是 pow(10-8, 2)=4。但是当有两个以上的类时,误差是如何计算的呢?

例如,预测在 MNIST 数据集上训练的数字的模型。在这种情况下,我们有 10 个标记实际值的标签 - 范围在 0-9 之间。但是如果我们使用 sigmoid 函数进行激活,那么可能预测值的范围在 0-1 之间。对?如果它们在不同的尺度上,我们如何比较这些值?例如,sigmoid 函数输出值 0.5,我们必须将其与 3 进行比较?

在此处输入图像描述

1个回答

这里的问题是您将回归问题与分类问题进行比较。分类 MNIST 数字被视为分类任务,因为假设预测错误的数字总是不好的,无论您与正确答案有多“接近”。甚至有人会争辩说,预测 9 而不是 3 比预测 5 更好。

如果您真的想比较这些值,我只需选择具有最高值的类并将其用作回归预测。