Ubuntu安装llama.cpp

第一步:安装 NVIDIA 驱动与 CUDA 环境

首先要让 Ubuntu 识别并能调用你的 3060 显卡。

1.安装驱动:

bash 复制代码
sudo ubuntu-drivers install
sudo reboot  # 重启以生效

重启后,输入 nvidia-smi。如果看到 3060 的显卡信息,说明驱动 OK。

2.安装构建工具与 CUDA Toolkit:

bash 复制代码
sudo apt update
sudo apt install -y build-essential cmake git libcurl4-openssl-dev nvidia-cuda-toolkit

确认编译器已就绪:输入 nvcc --version。

第二步:编译 llama.cpp (开启 CUDA 支持)

这是核心步骤,必须开启显卡加速选项。

bash 复制代码
# 1. 克隆代码
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

# 2. 配置并构建(指定开启 CUDA)
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j $(nproc)

第三步:运行与测试

将你的 *.gguf 模型文件放入 models 文件夹。

bash 复制代码
export LD_LIBRARY_PATH=/opt/llama.cpp/build/bin:$LD_LIBRARY_PATH

/opt/llama.cpp/build/bin/llama-server \
    -m /opt/llama.cpp/models/*.gguf \
    --port 8080 \
    --host 0.0.0.0 \
    -ngl 33 \
    --ctx-size 8192
相关推荐
xiaoye-duck1 分钟前
《Linux系统编程》Linux 进程间通信之管道基础解析:从匿名管道原理到基于管道的进程池实现
linux
z200509304 分钟前
【Linux学习】Linux中的进程程序替换
linux·服务器·学习
bush423 分钟前
嵌入式linux学习记录四
linux·运维·学习
lihao lihao1 小时前
软硬链接
linux·运维·服务器
YY&DS2 小时前
Qt 嵌入 CEF 在 Linux 下必须设置 `QT_XCB_GL_INTEGRATION=xcb_egl才能加载网页
linux·开发语言·qt
辰风沐阳2 小时前
ThinkPHP8.1 + think-swoole 4.1 使用指南(保姆级教程)
linux·后端·swoole
mounter6253 小时前
迈向硬件级无缝热升级:Linux 内核 VFIO 与 IOMMU 持久化技术的演进之路
linux·服务器·内存管理·kernel
晚风吹红霞3 小时前
Linux软件包管理器详解 —— yum与apt的使用及软件生态
linux·运维·服务器
曦夜日长3 小时前
Linux系统篇,进程概念(一):计算机体系、操作系统的认识、程序的加载过程
linux·运维·网络