cublas中的gemm
Published:
本文回顾cublas 中gemm 相关使用。
https://stackoverflow.com/questions/74884755/using-cublasgemmbatchedex https://salykova.github.io/sgemm-gpu
https://docs.nvidia.com/datacenter/dcgm/2.0/dcgm-user-guide/feature-overview.html#profiling-metrics
行主序中,在同一行的元素在内存中是相邻的;列主序中,同一列的元素在内存中是相邻的。
为什么 cublas 不做一个offline/init 函数,用来找到最佳策略,然后搭配一个run 函数
sudo nvidia-smi –lock-gpu-clocks=1695,1695
cublasSgemm(handle, CUBLAS_OP_N, CUBLAS_OP_N, 2 ,4, 3, &alpha, *A, 2, *B, 3, &beta, *C, 2);
