技术栈
nvprof
魔法自动机
1 年前
gpu
·
cuda
·
nvprof
·
nvvp
问题记录:GPU显卡提高后,代码总体运行效率没有提高
原先显卡NIVIDA T400换成NVIDIA RTX A4000,CUDA核心(物理GPU线程单位)从三百多提升到了六千多,但是程序总体运行的时间没有变化。