Ubuntu安装llama.cpp

第一步:安装 NVIDIA 驱动与 CUDA 环境

首先要让 Ubuntu 识别并能调用你的 3060 显卡。

1.安装驱动:

bash 复制代码
sudo ubuntu-drivers install
sudo reboot  # 重启以生效

重启后,输入 nvidia-smi。如果看到 3060 的显卡信息,说明驱动 OK。

2.安装构建工具与 CUDA Toolkit:

bash 复制代码
sudo apt update
sudo apt install -y build-essential cmake git libcurl4-openssl-dev nvidia-cuda-toolkit

确认编译器已就绪:输入 nvcc --version。

第二步:编译 llama.cpp (开启 CUDA 支持)

这是核心步骤,必须开启显卡加速选项。

bash 复制代码
# 1. 克隆代码
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

# 2. 配置并构建(指定开启 CUDA)
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j $(nproc)

第三步:运行与测试

将你的 *.gguf 模型文件放入 models 文件夹。

bash 复制代码
export LD_LIBRARY_PATH=/opt/llama.cpp/build/bin:$LD_LIBRARY_PATH

/opt/llama.cpp/build/bin/llama-server \
    -m /opt/llama.cpp/models/*.gguf \
    --port 8080 \
    --host 0.0.0.0 \
    -ngl 33 \
    --ctx-size 8192
相关推荐
骑着骆驼写程序24 分钟前
Ubuntu上部署前端项目报500错误
linux·运维·ubuntu
小娄~~1 小时前
进程间通信
linux·运维·服务器
实心儿儿2 小时前
Linux —— 库的制作和原理(2)
linux·运维·服务器
运维全栈笔记2 小时前
Docker一键部署Immich:自建私有云相册,照片视频备份无忧
linux·服务器·网络·docker·容器
进阶的猪2 小时前
主机、虚拟机、开发板网络通信排错日志
linux·网络
小小的木头人2 小时前
Ubuntu 26.04 换阿里云镜像源
linux·ubuntu·阿里云
qq_254674412 小时前
Ubuntu 20.04取消自动休眠的三种实现方案
linux·chrome·ubuntu
念恒123063 小时前
STM32---新建工程
linux·stm32·嵌入式硬件
LuDvei3 小时前
Windows x86 架构下 Ubuntu 虚拟机内打包 Qt 文件指南
windows·qt·ubuntu
悲伤小伞3 小时前
Linux_传输层协议TCP详解
linux·网络·c++·网络协议·tcp/ip