我写了一个 LSTM 网络。看起来一切都很好,但是当我训练网络时,每次迭代我都会得到大约 4.9e-4 的相同损失量!问题是什么?为什么我的网络不能减少损失金额?
什么意思:“一切看起来都很好,但损失不会减少!”
数据挖掘
lstm
损失函数
2022-02-26 00:02:27
1个回答
如果其他一切都还好,那么理想情况下,您的损失应该在每个时期都减少,这意味着您的模型正在相应地学习和更新权重。
稳定损失可能意味着您的模型具有过度拟合的数据。你的模型已经记住了数据,没有改进的余地。也许
1) 非常复杂的 LSTM 的数据较少。尝试使用非常简单的 LSTM。
2)在两者之间应用正则化层。
其它你可能感兴趣的问题