ubuntu24.04安装CUDA和VLLM

前期说明

系统具体版本:Ubuntu24.04.2-LTS

🔧 Ubuntu 24.04 专用 CUDA 安装步骤

bash 复制代码
# 1. 添加官方 NVIDIA 仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g')
echo "deb https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64 /" | sudo tee /etc/apt/sources.list.d/cuda.list

# 2. 添加签名密钥
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/3bf863cc.pub

# 3. 更新并安装 CUDA Toolkit
sudo apt update
sudo apt install -y cuda-toolkit-12-5  # 24.04 推荐使用 12.5 版本

# 4. 设置环境变量
echo 'export PATH=/usr/local/cuda-12.5/bin:$PATH' | sudo tee -a /etc/profile.d/cuda.sh
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.5/lib64:$LD_LIBRARY_PATH' | sudo tee -a /etc/profile.d/cuda.sh
source /etc/profile

# 5. 验证安装
nvcc --version  # 应显示 CUDA 12.5

💡 如果仍遇到依赖问题,使用以下替代方案

bash 复制代码
# 1. 安装基础依赖
sudo apt install -y build-essential libtinfo6 libncurses5

# 2. 创建符号链接解决兼容性问题
sudo ln -s /usr/lib/x86_64-linux-gnu/libtinfo.so.6 /usr/lib/x86_64-linux-gnu/libtinfo.so.5
sudo ln -s /usr/lib/x86_64-linux-gnu/libncurses.so.6 /usr/lib/x86_64-linux-gnu/libncurses.so.5

# 3. 仅安装核心组件
sudo apt install -y --no-install-recommends \
    cuda-compiler-12-5 \
    cuda-cudart-dev-12-5 \
    cuda-libraries-dev-12-5 \
    cuda-nvml-dev-12-5

✅ 验证安装是否成功

bash 复制代码
# 测试 CUDA
python -c "import torch; print(torch.cuda.is_available()); print(torch.version.cuda)"

# 测试 vLLM 基础功能
python -c "from vllm import LLM; print('vLLM loaded successfully')"

这样就安装成功了

⚠️ 针对 Ubuntu 24.04 的重要提示

  1. CUDA 版本选择

    • Ubuntu 24.04 官方支持 CUDA 12.5,不兼容CUDA12.4!
    • vLLM 完全兼容 CUDA 12.5
  2. Python 版本

    • Ubuntu 24.04 自带 Python 3.12
    • vLLM 目前建议使用 Python 3.10
    • 使用 Conda 创建独立 Python 3.10 环境
  3. 系统依赖

    bash 复制代码
    # 安装必要系统库
    sudo apt install -y libcusparse-12-5 libcublas-12-5 libcusolver-12-5
  4. 如果仍遇到问题,考虑使用 Docker 方案:

    bash 复制代码
    docker run --gpus all -it --rm nvcr.io/nvidia/pytorch:24.05-py3
    # 在容器内安装 vLLM
    pip install vllm
相关推荐
罗西的思考15 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab16 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab16 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸17 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云18 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny86518 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔18 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung18 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_18 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安19 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计