我正在使用 softmax 函数并尝试使用 softmax 的数值稳定性。如果我们将分子和分母中的指数增加相同的值,softmax 的输出保持不变(见下图,其中添加了 -Smax)。我不知道如何证明这种数值稳定性(尽管我读到这是真的)。任何人都可以帮我证明吗?
考虑到ea−b=ea⋅e−bea−b=ea⋅e−b, 所以:
esyi−smax∑esk−smax=esyie−smax∑eske−smax=esyie−smaxe−smax∑esk=esyi∑eskesyi−smax∑esk−smax=esyie−smax∑eske−smax=esyie−smaxe−smax∑esk=esyi∑esk