2026年最新 DeepSeek 本地部署教程：Ollama + Open WebUI 从安装到进阶

在线用DeepSeek确实方便，但用了一个月我就受不了了------高峰期对话卡30秒、传个代码文件担心泄露、免费版对话次数用完了就干瞪眼。

本地部署一次性解决这三个痛点：完全免费、数据不出门、7x24小时随时用。

我自己的配置：16GB内存的笔记本 + RTX 3060，跑DeepSeek-R1 7B版本丝滑流畅。如果你是4GB内存的轻薄本，1.5B版本也能跑。

一句话建议：普通人选7B（效果好又不吃配置），配置紧张选1.5B，有独立显卡的选14B。

Ollama现在是本地跑大模型的事实标准，一条命令下载运行，不用折腾CUDA环境。

去 ollama.com/download 下载安装包，macOS/Windows/Linux都支持，一路下一步就行。

打开终端，输入：

复制代码

ollama run deepseek-r1:7b

第一次会自动下载（约4GB），之后每次启动就几秒钟。

终端对话太硬核了。推荐装 Open WebUI，界面和ChatGPT一样好用：

复制代码

docker run -d -p 3000:8080 \
  -v open-webui:/app/backend/data \
  --name open-webui --restart always \
  ghcr.io/open-webui/open-webui:main

然后打开浏览器访问 http://localhost:3000，一个完整的类ChatGPT界面就有了------对话历史、Markdown渲染、代码高亮全都有。

把Ollama的 OLLAMA_HOST 环境变量设为 0.0.0.0，局域网内其他设备都能调用。我家里台式机跑模型，笔记本和手机都能用。

VS Code / JetBrains 安装 Continue 插件，配置指向本地Ollama。写代码时选中一段，Ctrl+L 直接让DeepSeek帮你解释或重构。

详细的Continue + DeepSeek配置教程，我之前写了一篇完整指南：DeepSeek本地部署全攻略

把PDF文档、技术手册丢进 AnythingLLM，底层用DeepSeek做推理，相当于给DeepSeek装了个"外挂知识库"。

用 ollama create + Modelfile 自定义量化参数，能让7B模型在6GB显存上跑起来。

Q: 本地跑的和在线版DeepSeek差距大吗？

A: 7B版本日常问答、代码编写、文案写作基本够用。但复杂推理（解数学题、长文逻辑分析）确实不如在线版。如果你要做专业级任务，建议14B起步。

Q: Mac能跑吗？

A: M系列芯片完美支持，M2 16GB跑7B版本毫无压力，而且功耗低风扇都不转。

Q: 和ChatGPT比怎么样？

A: 本地部署的优势是免费+隐私+无限制。能力上DeepSeek-R1 7B在代码和中文任务上与GPT-4o-mini相当，但创造性任务弱一些。适合作为日常助手，重要任务还是用在线版。

我持续更新DeepSeek相关的工具和技巧，更多内容可以参考：DeepSeek本地部署完整指南。

如果你在部署中遇到问题，欢迎评论区留言，我看到了会回。