考虑一个简单的ANN:
在哪里,和是矩阵,是逐点的 sigmoid 函数,通过比较输出返回一个表示损失的实数有目标, 最后表示数据流。
最小化超过和使用梯度下降,我们需要知道和,我知道有两种方法可以做到这一点:
- 明智地进行微分,并且很难弄清楚如何对其进行矢量化
- 展平和成一个行向量,并使用多元微积分(取一个向量,产生一个向量)进行微分
出于教程或说明的目的,以上两种方法可能就足够了,但是如果你真的想在现实世界中手动实现反向支持,你会用什么数学来做导数?我的意思是,meth 中是否有一个分支或方法可以教你如何对矩阵的向量值函数求导?