Sutton 和 Barto 中的矩阵表示法
数据挖掘
机器学习
强化学习
矩阵
2022-02-27 04:17:26
1个回答
在 Sutton & Barto 中,向量默认被视为列向量。所以如果你有这种产品:
其中和是维向量,它不计算标量积。相反,它将两个向量都视为矩阵并计算矩阵乘积,这将是一个矩阵,因为您将一个矩阵乘以一个矩阵。
值得注意的是,如果遵循相同的矩阵乘法规则但将第一个向量转置
这导致将1 × d矩阵矩阵。这就是为什么值函数近似可以写成(假设矩阵在符号方面与标量值相同,这是一个小小的自由)。
其它你可能感兴趣的问题
