为什么要把DeepSeek装到自己的电脑上?
在线用DeepSeek确实方便,但用了一个月我就受不了了------高峰期对话卡30秒、传个代码文件担心泄露、免费版对话次数用完了就干瞪眼。
本地部署一次性解决这三个痛点:完全免费、数据不出门、7x24小时随时用。
我自己的配置:16GB内存的笔记本 + RTX 3060,跑DeepSeek-R1 7B版本丝滑流畅。如果你是4GB内存的轻薄本,1.5B版本也能跑。
硬件门槛:你的电脑能跑哪个版本?
| 模型版本 | 最低内存 | 适合干什么 |
|---|---|---|
| 1.5B | 4GB | 聊天、写文案、翻译 |
| 7B | 8GB | 写代码、逻辑推理 |
| 14B | 16GB | 长文写作、复杂分析 |
| 32B | 24GB+ | 专业编程、科研 |
一句话建议:普通人选7B(效果好又不吃配置),配置紧张选1.5B,有独立显卡的选14B。
三步搞定:Ollama 部署(最简单方案)
Ollama现在是本地跑大模型的事实标准,一条命令下载运行,不用折腾CUDA环境。
第1步:装Ollama
去 ollama.com/download 下载安装包,macOS/Windows/Linux都支持,一路下一步就行。
第2步:下载模型
打开终端,输入:
ollama run deepseek-r1:7b
第一次会自动下载(约4GB),之后每次启动就几秒钟。
第3步:换个好看的界面
终端对话太硬核了。推荐装 Open WebUI,界面和ChatGPT一样好用:
docker run -d -p 3000:8080 \
-v open-webui:/app/backend/data \
--name open-webui --restart always \
ghcr.io/open-webui/open-webui:main
然后打开浏览器访问 http://localhost:3000,一个完整的类ChatGPT界面就有了------对话历史、Markdown渲染、代码高亮全都有。
进阶玩法:4个让DeepSeek更好用的技巧
1. 绑定到局域网
把Ollama的 OLLAMA_HOST 环境变量设为 0.0.0.0,局域网内其他设备都能调用。我家里台式机跑模型,笔记本和手机都能用。
2. 搭配 Continue 插件写代码
VS Code / JetBrains 安装 Continue 插件,配置指向本地Ollama。写代码时选中一段,Ctrl+L 直接让DeepSeek帮你解释或重构。
详细的Continue + DeepSeek配置教程,我之前写了一篇完整指南:DeepSeek本地部署全攻略
3. 用 AnythingLLM 做知识库问答
把PDF文档、技术手册丢进 AnythingLLM,底层用DeepSeek做推理,相当于给DeepSeek装了个"外挂知识库"。
4. 模型量化节省显存
用 ollama create + Modelfile 自定义量化参数,能让7B模型在6GB显存上跑起来。
常见问题
Q: 本地跑的和在线版DeepSeek差距大吗?
A: 7B版本日常问答、代码编写、文案写作基本够用。但复杂推理(解数学题、长文逻辑分析)确实不如在线版。如果你要做专业级任务,建议14B起步。
Q: Mac能跑吗?
A: M系列芯片完美支持,M2 16GB跑7B版本毫无压力,而且功耗低风扇都不转。
Q: 和ChatGPT比怎么样?
A: 本地部署的优势是免费+隐私+无限制。能力上DeepSeek-R1 7B在代码和中文任务上与GPT-4o-mini相当,但创造性任务弱一些。适合作为日常助手,重要任务还是用在线版。
我持续更新DeepSeek相关的工具和技巧,更多内容可以参考:DeepSeek本地部署完整指南。
如果你在部署中遇到问题,欢迎评论区留言,我看到了会回。