技术栈

nvprof

魔法自动机
2 年前
gpu·cuda·nvprof·nvvp
问题记录:GPU显卡提高后,代码总体运行效率没有提高原先显卡NIVIDA T400换成NVIDIA RTX A4000,CUDA核心(物理GPU线程单位)从三百多提升到了六千多,但是程序总体运行的时间没有变化。