需要解释矩阵乘法

数据挖掘 机器学习 神经网络 线性代数
2022-02-21 02:23:55

我正在阅读麻省理工学院的深度学习书。在第 172 页上,有这样的部分:

(1)f(1)(x)=h=WTx
(2)f(2)(h)=hTw
将(1)代入(2),得到:
f(x)=wTWTx
由于我对线性代数的东西不太熟悉,因此我推断以下内容是有效的:
(3)ATB=BTA
那么(3)的性质叫什么?

1个回答

让我们一步一步来。

(1)f(1)(x)=h=WTx

(2)f(2)(h)=hTw

我们替代h

(3)f(x)=(WTx)Tw

为了让它发挥作用,我们会做一个小技巧。

转置矩阵的转置是原始矩阵。

(AT)T=A

我们替代w

(4)f(x)=(WTx)T(wT)T

现在我们使用以下内容:

(AB)T=BTAT

两个矩阵相乘的转置与它们的转置矩阵逆序的乘积相同。

瞧瞧

f(x)=wTWTx