技术栈
cuda编程
Briwisdom
1 年前
cuda编程
·
matmul
·
矩阵乘
基于矩阵乘的CUDA编程优化过程
背景:网上很多关于矩阵乘的编程优化思路,本着看理论分析万遍,不如实际代码写一遍的想法,大概过一下优化思路。
极智视界
1 年前
cuda
·
device
·
cuda编程
·
constexpr
·
host
记录 | CUDA编程中用constexpr替代__host__&__device__
比如用 __host__ & __device__ 的情况如下:则可以用 constexpr 来替代 __host__ __device,替代后的代码如下:
colourmind
1 年前
c++
·
深度学习
·
cuda编程
CUDA编程二、C++和cuda混合编程的一些基础知识点
目录一、C++运行过程1、C++编译过程2、代码运行示例单文件多文件a、编译所有cpp文件,但是不链接