技术栈

cublas

吃肉夹馍不要夹馍
6 个月前
cuda·cublas·gemm·cublaslt
CublasLt 极简入门官方文档: cublasLt文档网上搜了挺多,Cublas的文档有不少,但是对于cuda10以上轻量化的cublasLt 的文档或博客却很少。
Arnold-FY-Chen
2 年前
人工智能·pytorch·cublas·dcn·thc·aten
解决DCNv2不能使用高版本pytorch编译的问题可变形卷积网络GitHub - CharlesShang/DCNv2: Deformable Convolutional Networks v2 with Pytorch代码已经出来好几年了,虽然声称"Now the master branch is for pytorch 1.x",实际上由于pytorch自1.11版开始发生了很大变化,原来基于C实现的THC封装实现的调用cuda、cudnn和cublas的API(只能用NVIDIA的GPU)被基于C++实现的ATen和c10里的API代替(ATen通
Thomas_Cai
2 年前
线性代数·矩阵·cuda·cublas·gemm
VS2015+cublas实操记录(cuda加速GEMM矩阵乘加算子)cuda安装后一般的安装位置在:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8 把这个目录下的include和lib分别配置在vs中,安装cuda教程可参考:https://zhuanlan.zhihu.com/p/520995962(笔者实操ok版本:win11+cuda11.8+cdunn8.2.1.32+trt8.5.3.1)。 另外还要记得添加附加依赖项: