我想执行矩阵乘法,例如:
使用 cusparse 库函数 cusparseDcsrgemm2。
为此,我将其拆分为两个矩阵-矩阵乘法,其中所有矩阵都以 CSR 格式存储,索引从零开始,在 cusparse 矩阵描述中指定。然而,第一个矩阵乘法工作正常,但第二个矩阵乘法在确定结果矩阵的非零数时失败。矩阵的 CSR 格式应该没问题。不幸的是,矩阵太大了,我无法手动检查格式。执行 cusparseDcsrgemm2 函数时需要满足哪些矩阵要求?有没有可以检查矩阵的辅助函数?也许在cuda之外?
cusparse*csrgemm2 的矩阵要求
计算科学
稀疏矩阵
库达
2021-12-22 04:55:20
1个回答
似乎 cusparse 库希望 CSR 矩阵是有序的。如果矩阵未排序,则 cusparse 函数将失败。订购有助于解决上述问题。