我已经为三个类别的分类建立了一个网络。该网络由一个 CNN 和两个全连接层组成。CNN 由卷积层、批归一化、RELU 激活、最大池化和 drop out 组成。这三个类别是不平衡的(如下面的混淆矩阵所示)。我已经优化了网络的参数以最大化 AUC。
我正在使用宏观和微观平均计算 AUC。从 ROC 图中可以看出,AUC 并没有那么糟糕。另一方面,混淆矩阵看起来很糟糕,尤其是第一(低)类的预测很差。网络倾向于预测多数类别。作为网络的输出,我得到了每个类的概率。然后,我只是根据创建混淆矩阵的最大概率来上课。
我在训练网络时尝试使用平衡的类权重(以fitKeras 的方法)。这有助于网络也更频繁地预测少数类,但另一方面 AUC 正在下降。
有没有办法从 ROC 图推断概率阈值?我认为对于两个类,可以通过采用 ROC 图推断出最佳概率阈值,max(TPR - FPR)但这里我有三个类......或者还有另一种方法吗?

