如果多类神经网络的多个最终预测值相等怎么办

数据挖掘 机器学习 神经网络 软最大
2022-03-10 11:00:25

例如,如果你对一个多类问题的最终预测,比如 ["mouse","cat","dog","lion"],是 [0.1,0.3,0.3,0.3],那么神经网络应该预测这个数据是“猫”、“狗”还是“狮子”?这应该随机选择吗?

3个回答

我想说,对于一个经过足够时期训练并且不会过度拟合的模型,具有绝对相等的概率并不常见。

也就是说,如果你碰巧有相同的概率,那么要预测的类的选择应该取决于你正在接近的领域,例如:

  • 一个可能的实现就像在 numpy 的 argmax 中一样,通过选择第一个索引。
  • 您还可以在您的测试集中专门针对这个问题创建一个新的“未知”类。
  • 如果您犯了错误并预测“2”类而不是“1”类,对您的业务问题是否更糟?然后,您应该选择错误概率较低的类别(考虑医学领域并预测癌症的几个阶段)
  • 班级余额一样吗?您可以选择训练集中最可能的课程

你可以试试:

  • 对数据进行上采样。
  • 尝试预处理数据(EDA)。
  • 使用逻辑回归为每个类构建一个二元模型,以提高模型的性能和准确性。

它将随机选择,但该输出的模型的置信水平将非常低(此处为 30%)