Deepseek r1 本地部署

small_blackca2025-03-19 9:58

根据显存选择对应大小的模型，推荐能将整个模型放入显存的大小，放不下的话会将一部分放到内存中，生成速度会变慢，最佳效果是显存>模型大小*2；

如选择 7b 模型，则 cmd 输入ollama run deepseek-r1，下载速度比较慢的话可以使用 Ctrl+C 断联在重新下载，会自动继续。

安装 cuda 能加速字符的生成。

图形界面，自动读取 ollama 中的模型，便于使用。 // 安装pip install open-webui// 启动open-webui serve

Ps. 我的电脑配置是 i5-12450k + 4050 8g

* Deepseek-r1 14b 模型加载时间在30-60s，每秒钟2-3个中文字符的生成速度，时间上基本是不可用状态；

* Deepseek-r1 7b 模型加载时间在5s左右，每秒钟10-20个中文字符的生成速度，已经赶上了在线模型的速度；

* 在一些通用问题上，7b和14b的模型效果没有明显的区别。