最简单的方式:如何在wsl2上配置CDUA开发环境

step0:序言

这篇文章可以帮助你以一个最为简单的方式迈出CUDA的第一步,从此一入CUDA深似海,从此头发是路人。

前提:你需要在Windows 11上:

  • 电脑中有nvidia显卡以及驱动,由于wsl cuda不支持maxwell gpu架构,所以需要10系以上的显卡
  • 安装wsl2,配置ubuntu镜像并确定能够进入。

此处使用:

  • 操作系统镜像为:ubuntu 22.04.3 LTS
  • 安装cuda版本:12.8.1

注意,在wsl上配置cuda与在普通Linux上配置有程序上的不同,务必注意!

step1:前期准备

由于此处使用的ubuntu 22.04.x版本,我们需要做一些前期配置

可以从这个链接中查询cuda 12.8.1和操作系统,内核,gcc,glibc版本的对应关系:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

理论上来说其他版本也不一定不支持,但是出于少给自己找麻烦的需求,按照官方教程更新版本

确认操作系统和工具链版本:

复制代码
lsb_release -a # 确认操作系统版本
gcc -v # 确认gcc版本
cmake --version # 确认cmake版本
ldd --version # 确认glibc版本

安装gcc12.3.0:

复制代码
sudo apt install gcc-12 g++-12 -y
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 100
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-12 100
gcc --version # 确认gcc版本

安装cmake(截至本文撰写cmake latest version为3.22.1):

复制代码
sudo apt install cmake
cmake --version

至此,先期工具链已经配置完成。

step2:安装CUDA toolkit

CUDA toolkit是开发过程中必备的工具链,本阶段我们需要安装并配置。

参考官方教程:

既有的运行用的CUDA和编译开发用的CUDA toolkit完全是两个东西,不要搞混。

严格按照以下代码执行,顺序不要改变:

复制代码
sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin
sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.8.1/local_installers/cuda-repo-wsl-ubuntu-12-8-local_12.8.1-1_amd64.deb
sudo dpkg -i cuda-repo-wsl-ubuntu-12-8-local_12.8.1-1_amd64.deb
sudo cp /var/cuda-repo-wsl-ubuntu-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8
sudo apt-get install cuda

step3:尝试编译并运行sample项目

nvidia官方提供了一个sample项目,用于初学者快速上手CUDA:

执行如下代码,从github中clone并构建

复制代码
git clone https://github.com/NVIDIA/cuda-samples.git
cd cuda-samples/
mkdir build && cd build
export PATH=/usr/local/cuda-12.8/bin/:$PATH
cmake ..

也可以进入某一个具体项目路径下编译并运行,此处以vectorAdd为例:

复制代码
cd Samples/0_Introduction/vectorAdd
cmake .
make
./vectorAdd

如果一切顺利,你将会看到如下输出:

复制代码
~/cuda-samples/Samples/0_Introduction/vectorAdd$ ./vectorAdd 
[Vector addition of 50000 elements]
Copy input data from the host memory to the CUDA device
CUDA kernel launch with 196 blocks of 256 threads
Copy output data from the CUDA device to the host memory
Test PASSED
Done

至此,已经完成了所有配置,你应该能够在自己的wsl中自由编译并运行CUDA程序了。

下一期我们开始正式进入CUDA的世界,从CUDA kernel开始,压榨GPU的每一寸性能,在这个过程中你会深切感受到算力的强大。

以上,感谢阅读,如果你认为这篇文章有帮助,关注雪豹喵,关注雪豹谢谢喵。

相关推荐
lifewange5 分钟前
Linux 日志查看核心命令(动态跟踪 + 文件查阅,全覆盖工作常用)
linux·运维·服务器
JiMoKuangXiangQu9 分钟前
Linux 网络:RPS 简介
linux·网络·rps 和 rfs
Awkwardx16 分钟前
Linux网络编程—五种IO模型与非阻塞IO
linux·服务器·网络
小鹏linux32 分钟前
【linux】进程与服务管理命令 - pkill
linux·运维·服务器
ChenXinBest40 分钟前
一次firewalld和docker冲突问题排查
linux·docker
墨白曦煜44 分钟前
计算机组成原理:大端序与小端序的原理与权衡
linux·windows
老兵发新帖1 小时前
ubuntu Nano常用指令
linux·运维·ubuntu
培之1 小时前
联想拯救者windows11装ubuntu双系统要点
linux·运维·ubuntu
南山nash1 小时前
Linux 系统如何释放内存
linux·运维·服务器
xuhe21 小时前
[重磅更新] 支持最新 Overleaf 6.x!我的私有化部署方案 xuhe2/sharelatex-ce 迎来大升级
linux·docker·github·科研·overleaf