矩阵大小 LAPACK 可以支持 3 级 BLAS

计算科学 拉帕克
2021-12-02 19:54:06

我是使用 LAPACK 库的新手。我知道 LAPACK 的内部程序将大问题递归地分解为较小的问题(我正在考虑 3 级 BLAS)。如果我们考虑矩阵乘法 C= AB+C 的例子,直到什么大小(最大和最小)我们可以划分更大的矩阵?(128 x 128) 是最小的尺寸吗?

2个回答

比尔在他的评论中正确地说明了这一点。参考 BLAS 实现使用三重嵌套循环,但任何快速实现都将使用小面板矩阵。最小尺寸将取决于架构和实现。您应该参考Goto 论文以了解详细信息。

LAPACK (DGEMM) 中的矩阵乘法不是递归的,至少在Netlib 实现中不是。它将矩阵乘法实现为三重嵌套循环。