cublas中的gemm

less than 1 minute read

Published:

本文回顾cublas 中gemm 相关使用。

Row_and_column_major_order svg

gemm

https://stackoverflow.com/questions/74884755/using-cublasgemmbatchedex https://salykova.github.io/sgemm-gpu

https://docs.nvidia.com/datacenter/dcgm/2.0/dcgm-user-guide/feature-overview.html#profiling-metrics

行主序中,在同一行的元素在内存中是相邻的;列主序中,同一列的元素在内存中是相邻的。

为什么 cublas 不做一个offline/init 函数,用来找到最佳策略,然后搭配一个run 函数

sudo nvidia-smi –lock-gpu-clocks=1695,1695

cublasSgemm(handle, CUBLAS_OP_N, CUBLAS_OP_N, 2 ,4, 3, &alpha, *A, 2, *B, 3, &beta, *C, 2);