2026年最新 DeepSeek 本地部署教程:Ollama + Open WebUI 从安装到进阶

为什么要把DeepSeek装到自己的电脑上?

在线用DeepSeek确实方便,但用了一个月我就受不了了------高峰期对话卡30秒、传个代码文件担心泄露、免费版对话次数用完了就干瞪眼。

本地部署一次性解决这三个痛点:完全免费、数据不出门、7x24小时随时用

我自己的配置:16GB内存的笔记本 + RTX 3060,跑DeepSeek-R1 7B版本丝滑流畅。如果你是4GB内存的轻薄本,1.5B版本也能跑。


硬件门槛:你的电脑能跑哪个版本?

模型版本 最低内存 适合干什么
1.5B 4GB 聊天、写文案、翻译
7B 8GB 写代码、逻辑推理
14B 16GB 长文写作、复杂分析
32B 24GB+ 专业编程、科研

一句话建议:普通人选7B(效果好又不吃配置),配置紧张选1.5B,有独立显卡的选14B。


三步搞定:Ollama 部署(最简单方案)

Ollama现在是本地跑大模型的事实标准,一条命令下载运行,不用折腾CUDA环境。

第1步:装Ollama

ollama.com/download 下载安装包,macOS/Windows/Linux都支持,一路下一步就行。

第2步:下载模型

打开终端,输入:

复制代码
ollama run deepseek-r1:7b

第一次会自动下载(约4GB),之后每次启动就几秒钟。

第3步:换个好看的界面

终端对话太硬核了。推荐装 Open WebUI,界面和ChatGPT一样好用:

复制代码
docker run -d -p 3000:8080 \
  -v open-webui:/app/backend/data \
  --name open-webui --restart always \
  ghcr.io/open-webui/open-webui:main

然后打开浏览器访问 http://localhost:3000,一个完整的类ChatGPT界面就有了------对话历史、Markdown渲染、代码高亮全都有。


进阶玩法:4个让DeepSeek更好用的技巧

1. 绑定到局域网

把Ollama的 OLLAMA_HOST 环境变量设为 0.0.0.0,局域网内其他设备都能调用。我家里台式机跑模型,笔记本和手机都能用。

2. 搭配 Continue 插件写代码

VS Code / JetBrains 安装 Continue 插件,配置指向本地Ollama。写代码时选中一段,Ctrl+L 直接让DeepSeek帮你解释或重构。

详细的Continue + DeepSeek配置教程,我之前写了一篇完整指南:DeepSeek本地部署全攻略

3. 用 AnythingLLM 做知识库问答

把PDF文档、技术手册丢进 AnythingLLM,底层用DeepSeek做推理,相当于给DeepSeek装了个"外挂知识库"。

4. 模型量化节省显存

ollama create + Modelfile 自定义量化参数,能让7B模型在6GB显存上跑起来。


常见问题

Q: 本地跑的和在线版DeepSeek差距大吗?

A: 7B版本日常问答、代码编写、文案写作基本够用。但复杂推理(解数学题、长文逻辑分析)确实不如在线版。如果你要做专业级任务,建议14B起步。

Q: Mac能跑吗?

A: M系列芯片完美支持,M2 16GB跑7B版本毫无压力,而且功耗低风扇都不转。

Q: 和ChatGPT比怎么样?

A: 本地部署的优势是免费+隐私+无限制。能力上DeepSeek-R1 7B在代码和中文任务上与GPT-4o-mini相当,但创造性任务弱一些。适合作为日常助手,重要任务还是用在线版。


我持续更新DeepSeek相关的工具和技巧,更多内容可以参考:DeepSeek本地部署完整指南

如果你在部署中遇到问题,欢迎评论区留言,我看到了会回。