全流程安装DeepSeek开源模型

目录

配置要求

我的电脑配置为:

复制代码
CPU:i7 12代
GPU:3080
内存:32g
磁盘:1T

以上配置运行情况:

复制代码
运行ollama run deepseek-r1:7b模型无压力,CPU/GPU使用率在 10% 左右。
运行ollama run deepseek-r1:32b模型输出明显变慢,大概 1 秒 2 ~4个 Token,CPU/GPU使用率在 70% 左右。

ChatGpt给出的部署推荐配置如下:

1. DeepSeek-R1 系列(轻量级部署)

适用于个人开发者、小型研究团队或资源有限的服务器。

模型版本 参数量 显存需求 推荐配置
DeepSeek-R1-1.5B 1.5B 8GB+ RTX 3060 (12GB) / RTX 4060 Ti (16GB)
DeepSeek-R1-7B 7B 24GB+ RTX 3090 / 4090 (24GB) / A6000 (48GB)
DeepSeek-R1-14B 14B 40GB+ RTX 4090 (24GB, 量化后可跑) / A100 (40GB)
DeepSeek-R1-32B 32B 80GB+ A100 80GB / H100 (80GB)
DeepSeek-R1-70B 70B 128GB+ 2×A100 80GB (或更大GPU集群)

建议:

  • 7B及以下的模型可以在高端消费级显卡上运行(如4090),但需要使用 4-bit/8-bit 量化 降低显存占用(可用
    bitsandbytes)。
  • 14B以上的模型推荐使用 专业级显卡(A100, H100),或者 多卡并行 方案。

2. DeepSeek-V3 系列(高性能部署)

适用于企业、学术机构或大规模推理应用。

模型版本 参数量 显存需求 推荐配置
DeepSeek-V3 (37B 激活参数) 37B 128GB+ A100 80GB ×2 / H100 80GB
DeepSeek-V3 (671B 总参数) 671B 1.5TB+ H100 80GB ×16+ (或更大GPU集群)

建议:

  • DeepSeek-V3 37B 可以在多张 A100 80GB 上运行(如 2×A100 80GB),建议采用 TPU 或多卡并行(FSDP, ZeRO) 进行优化。
  • DeepSeek-V3 671B 需要 云端或超算集群,适用于 数据中心 或 高端AI研究实验室。

实测 3080的 gpu也可以运行 32b模型,只是输出会慢一些,大概 1 秒 2 ~4个 Token。

安装Ollama

安装DeepSeek首先需要安装一个Ollama,这个软件相当于运行DeepSeek模型的底层,没有这个底层就没办法跑DeepSeek AI模型。

下载地址:

复制代码
https://ollama.com/

点击下载windows版本:

点击Install

默认在c盘,不能修改,需要5G的磁盘大小。

安装好了以后在开始菜单可以查看有没有Ollama应用

选择大模型

直接命令安装:

DeepSeek提供的模型如下

复制代码
版本:1.5b,适用于一般文字编辑使用(需要1.1GB空余空间)
ollama run deepseek-r1:1.5b

版本:7b,DeepSeek的第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要
4.7GB空余空间)
ollama run deepseek-r1:7b

版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b

版本:14b,(需要9GB空余空间)
ollama run deepseek-r1:14b

版本:32b,(需要20GB空余空间)
ollama run deepseek-r1:32b

版本:70b,(需要43GB空余空间)
ollama run deepseek-r1:70b

版本:671b,(需要404GB空余空间)
ollama run deepseek-r1:671b

官网选择模型:

打开地址:

复制代码
https://ollama.com/search

选择Models

选择deepseek-r1模型,左侧选择模型参数,右侧复制安装命令

安装大模型

打开终端,如果选择复制7b版本,可以复制如下命令:

复制代码
ollama run deepseek-r1:7b

在终端内执行

等待下载完成

下载结束之后就有一小会儿出现【verifying sha256 digest】,是在检查完整性之类的东西,请耐心等待(模型越大等待时间越长)

成功之后会提示success

对话

安装成功后会可以直接输入问题按回车提问。

当然,终端的展示效果还是不太好,这时候就需要安装一下openWebUi,需要docker环境,如果没有安装docker的安装一个docker。

终端执行以下命令:

复制代码
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

等待docker启动成功

安装完成后通过如下地址访问openWebUi:

复制代码
http://localhost:3000 

第一次进入需要设置一下管理员的账号密码。

随后进入主页,左侧会展示当前我们运行的模型。然后你就可以尽情的问他了。

备注

查看当前本地ollama有的模型命令:

复制代码
ollama list

运行已有模型命令:

复制代码
ollama run 模型名称

示例:

复制代码
>ollama run deepseek-r1:7b

可供下载的模型:

复制代码
版本:1.5b,适用于一般文字编辑使用(需要1.1GB空余空间)
ollama run deepseek-r1:1.5b

版本:7b,DeepSeek的第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要
4.7GB空余空间)
ollama run deepseek-r1:7b

版本:8b,(需要4.9GB空余空间)
ollama run deepseek-r1:8b

版本:14b,(需要9GB空余空间)
ollama run deepseek-r1:14b

版本:32b,(需要20GB空余空间)
ollama run deepseek-r1:32b

版本:70b,(需要43GB空余空间)
ollama run deepseek-r1:70b

版本:671b,(需要404GB空余空间)
ollama run deepseek-r1:671b
相关推荐
小白跃升坊9 小时前
Codex 增强部署:基于 Codex++ 接入 DeepSeek
ai·ai编程·codex·deepseek·ai coding·codex++
AlfredZhao9 小时前
GPT 省钱,不是别用最新模型,而是别浪费缓存
gpt·ai
大模型真好玩10 小时前
什么是Loop Engineering?最通俗易懂的Loop Engineering核心概念
人工智能·agent·deepseek
doiito12 小时前
【Agent Harness】Gliding Horse 本体论系统设计:给 AI Agent 装上“语义大脑”
ai·rust·架构设计·系统设计·ai agent
小七-七牛开发者19 小时前
周一上线 | SpaceX 收购 Cursor、支付宝进入 AI 时代、DeepSeek 完成 500 亿元融资
ai·agent·token·glm·智谱·claudecode·ai coding·周一上线
doiito2 天前
【Agent Harness】为什么我把 JSON‑LD “编译成 DAG” 后,整个 Agent 平台立刻聪明了
ai·rust·架构设计·系统设计·ai agent
xiezhr2 天前
折腾半小时,终于让AI 能直接帮我写飞书文档了
ai·飞书·ai agent·飞书cli·飞书文档
岳小哥AI2 天前
Claude Fable和Claude Mythos 5同时发布:注意力机制下愈加强大的AI大模型
ai·ai基础
Artech2 天前
[MAF预定义的AIContextProvider-04]Mem0Provider——长期记忆基于的云端解决方案
ai·agent·maf·aicontextprovider·chathistorymemoryprovider·mem0provider
哥不是小萝莉2 天前
一文读懂 OpenAI Codex 源码的原理、架构与未来
ai