谁能告诉我一些非常好的/高效的 GPU/CUDA 数值算法来计算稀疏矩阵之间的乘法/(如果您可以推荐我一些研究论文,那就太好了)?
我搜索了一些关于稀疏向量的论文,但看起来他们对涉及稀疏矩阵和密集向量的运算更感兴趣,但我正在处理的是一些数学运算只涉及稀疏矩阵和稀疏向量。
谢谢!
谁能告诉我一些非常好的/高效的 GPU/CUDA 数值算法来计算稀疏矩阵之间的乘法/(如果您可以推荐我一些研究论文,那就太好了)?
我搜索了一些关于稀疏向量的论文,但看起来他们对涉及稀疏矩阵和密集向量的运算更感兴趣,但我正在处理的是一些数学运算只涉及稀疏矩阵和稀疏向量。
谢谢!
Nvidia 的 cuSPARSE 库实现了标准稀疏 blas 库中的函数,但稀疏 blas 不包括稀疏矩阵乘以稀疏向量的乘法。然而,cuSPARSE 也有一个稀疏矩阵乘以稀疏矩阵的乘法例程,它超越了稀疏 blas。