wsl中llama.cpp源码编译

sxjlinux2026-05-23 8:03

1、下载源码，从地址：https://github.com/ggml-org/llama.cpp下载，如下图所示：

2、安装cuda，安装方法请看地址：https://blog.csdn.net/sunxiaoju/article/details/157170558?spm=1011.2415.3001.5331中的安装方法，安装好之后还需要安装：

bash 复制代码

apt install nvidia-cuda-toolkit

然后执行如下命令：

bash 复制代码

nvcc -V

如下图所示：

3、安装如下工具：

bash 复制代码

apt install -y build-essential cmake git wget
apt install libssl-dev

4、然后进入到llama.cpp源码目录创建一个build文件夹如：

bash 复制代码

mkdir build
cd build/
cmake .. -DGGML_CUDA=ON -DCMAKE_BUILD_TYPE=Release
cmake --build . --config Release -j$(nproc) 


mkdir -p /usr/share/llama.cpp/bin
cp bin/* /usr/share/llama.cpp/bin/
vim ~/.bashrc
export PATH=$PATH:/usr/share/llama.cpp/bin

编译过程中出现如下错误：

那就手动安装，通过如下命令安装：

bash 复制代码

npm install -g ws@8.20.1 --verbose

5、然后查看版本：

bash 复制代码

./bin/llama-cli --version