LSTM损失函数的量有没有标准或正常范围?

数据挖掘 lstm 损失函数
2022-03-04 00:06:35

我正在研究一个 LSTM 网络,我的损失量约为 4.7 e-4 。似乎添加更多层和增加时代无助于减少它。我还Dropout = 0.2为我的每个图层使用了一个,并使用 Keras 库实现了所有作业。

我想知道这个损失金额?这个大还是可以> 是否有任何损失的经验法则?

为什么我不能减少我的损失金额?这里有什么问题吗?

1个回答

尽管您的损失函数表明模型训练的好坏,但通常使用其他更直观的指标来评估模型的好坏。

如果您正在寻找分类问题,您的损失函数很可能是交叉熵。关于损失函数,重要的是了解它在训练期间的行为,而不是它的价值。

在训练期间降低其值的损失函数表明模型正在有效地训练。损失函数将在某个时候开始降低其值,这意味着模型已达到最小值。还需要了解损失函数在训练和验证集中的相互作用,以及如何检测过拟合等问题。如果你不知道这一点,有很多关于这个话题的文献。

要知道一个模型有多好,我会使用其他指标来提供更好的指示和直觉。例如,在分类问题中,pne 可以查看诸如 Precision、Recall、Accuracy(如果类不是很不平衡)甚至 ROC AUC 之类的东西。如果是回归问题,也许您对平均或中值绝对百分比误差(MdAPE 或 MAPE)更感兴趣。