ubuntu25安装deepseek32b量化版

  1. 系统要求检查

    检查系统版本

    lsb_release -a

    检查GPU(如果有)

    nvidia-smi

    lspci | grep -i nvidia

  2. 安装依赖

    更新系统

    sudo apt update && sudo apt upgrade -y

    安装基本工具

    sudo apt install -y python3-pip python3-venv git wget curl

    安装CUDA工具(如使用NVIDIA GPU)

    CUDA 12.1示例,根据实际情况选择版本

    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
    sudo dpkg -i cuda-keyring_1.1-1_all.deb
    sudo apt update
    sudo apt install -y cuda-toolkit-12-1

  3. 创建Python虚拟环境

    创建目录

    mkdir -p ~/deepseek && cd ~/deepseek

    创建虚拟环境

    python3 -m venv venv
    source venv/bin/activate

  4. 安装PyTorch

    根据CUDA版本选择合适的PyTorch

    CUDA

    pip install torch torchvision torchaudio

    或CPU版本

    pip install torch torchvision torchaudio

  5. 安装模型运行环境

    安装Transformers和相关库

    pip install transformers accelerate bitsandbytes
    pip install sentencepiece protobuf

    对于GGUF量化格式

    pip install llama-cpp-python

    pip install ctransformers[cuda] # 如使用GPU

  6. 下载DeepSeek 32B量化模型

    安装Ollama

    curl -fsSL https://ollama.com/install.sh | sh

    下载DeepSeek 32B量化版

    ollama pull deepseek-r1:32b

    或指定量化版本

    ollama pull deepseek-r1:32b-q4_K_M

由于在线安装资源太慢这里选择下载好后直接上传解压

官网地址:Download Ollama on Linux

GitHub手动安装文档地址:ollama/docs/linux.md at main .ollama/ollama .GitHub

安装包下载地址:https://ollama.com/download/ollama-linux-amd64.tgz

上传后解压:

复制代码
sudo tar -C /usr -xzf ollama-linux-amd64.tgz

设置权限:

复制代码
sudo chmod +x /usr/bin/ollama

创建系统用户:为Ollama服务创建一个专用的、无登录权限的系统用户,这有助于提高安全性

复制代码
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama

创建服务文件:创建一个systemd服务配置文件。使用文本编辑器创建并编辑文件:

复制代码
sudo vim /etc/systemd/system/ollama.service

将以下配置内容粘贴到文件中。这个配置设置了服务的基本信息、启动方式以及运行用户

复制代码
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
# 如需允许局域网内其他机器访问,取消下面一行的注释
# Environment="OLLAMA_HOST=0.0.0.0"
# 明确指定模型存储目录,防止权限问题
Environment="HOME=/usr/share/ollama"

[Install]
WantedBy=multi-user.target

设置目录权限:确保Ollama用户对其工作目录有读写权限

复制代码
sudo chown -R ollama:ollama /usr/share/ollama

启用并启动服务

复制代码
sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama

检查服务状态:使用以下命令查看Ollama服务是否正常运行。

复制代码
sudo systemctl status ollama

下载DeepSeek 32B量化版

复制代码
ollama pull deepseek-r1:32b

使用Ollama运行:

复制代码
ollama run deepseek-r1:32b
相关推荐
若风的雨24 分钟前
安全与验证模块设计方案
linux·安全
Fᴏʀ ʏ꯭ᴏ꯭ᴜ꯭.1 小时前
Haproxy ACL实战:精准分流与访问控制
运维
Eiceblue1 小时前
.NET框架下Windows、Linux、Mac环境C#打印PDF全指南
linux·windows·.net
RockHopper20251 小时前
解读数字化生产运行系统的裁决机制
运维·系统架构·智能制造·isa-95·isa-88
试试勇气1 小时前
Linux学习笔记(十三)--文件系统
linux·笔记·学习
guizhoumen1 小时前
2026年建站系统推荐及选项指南
大数据·运维·人工智能
yingdonglan1 小时前
鸿蒙跨端Flutter学习——GridView高级功能
linux·运维·windows
2301_803554521 小时前
阻塞,非阻塞,同步,异步以及linux上的5种IO模型阻塞,非阻塞,信号驱动,异步,IO复用
java·服务器·网络
wdfk_prog2 小时前
[Linux]学习笔记系列 -- [drivers][clk]clk
linux·笔记·学习
Genie cloud2 小时前
外贸独立站建站完整教程
服务器·数据库·云计算