我正在玩卷积神经网络,使用 Keras+Tensorflow 对分类数据进行分类。我有两个损失函数可供选择:categorial_crossentropy和sparse_categorial_crossentropy。
我对categorial_crossentropy损失函数有一个很好的直觉,它的定义如下:
在哪里,
- 指的是模型参数,例如神经网络的权重
- 是真正的标签
- 是预测的标签
两个标签都使用 one-hot 编码方案。
问题:
- 上述损失函数如何变化
sparse_categorial_crossentropy? - 它背后的数学直觉是什么?
- 什么时候使用一个而不是另一个?