高端入门：Ollama 本地高效部署DeepSeek模型深度搜索解决方案

[一、Ollama 介绍](#一、Ollama 介绍)

[2.1 官网下载](#2.1 官网下载)

[2.2 GitHub下载](#2.2 GitHub下载)

[四、Ollmal 使用](#四、Ollmal 使用)

[4.1 模型运行（下载）](#4.1 模型运行（下载）)

[4.2 模型提问](#4.2 模型提问)

[五、Ollama 常用命令](#五、Ollama 常用命令)

一、Ollama 介绍

Ollama是一个专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计的开源框架。以下是对Ollama的详细解释：

Ollama 支持多平台部署，可以在官网，选择适合的平台进行下载，如下图：

Ollama 支持在ollama.com/search 上获取的模型列表，比如最近比较火的 deepseek-r1：

不同版本的模型所需内存大小也有所不同。例如在Ollama中部署DeepSeek-R1的不同版本（1.5b、7b、8b、14b、32b、70b、671b）所需的内存大小：

DeepSeek-R1版本	所需内存（大约）	备注
1.5b	1.1GB硬盘空间	内存需求相对较低
7b	4.7GB硬盘空间	内存和显存需求适中
8b	约4.9GB硬盘空间	显存占用约6.5GB左右
14b	约9GB硬盘空间	内存需求较高，建议至少8GB以上内存，显存占用约13GB
32b	约20GB硬盘空间	需要更高的内存和显存配置，建议至少32GB内存
70b	约43GB硬盘空间	需要非常大的内存和显存资源，适合高端配置
671b	约404GB硬盘空间	这是目前提到的最大版本，所需内存和显存资源将是所有版本中最高的

根据自身需要选择版本，如下是我之前下的几个模型的版本和所占内存大小：

打开命令终端，输入指令 ollama run xxxx(模型名称，如deepseek-r1)，若是首次运行某个模型，Ollma 会先下载对应的模型文件，然后运行模型。

复制代码

//下载7b版本
ollama run deepseek-r1

//下载14b版本
ollama run deepseek-r1:14b

可以根据不同命令下载不同版本，怎么获取命令？你可以先选中模型的版本，ollama 会根据不同的版本生成命令，如下图所示：

ollama serve:该命令用于启动Ollama服务器(在不运行桌面应用程序的情况下启动 ollama;)，以便运行模型和处理请求。首次启动可能会生成ssh私钥文件，并提示服务端口状态。
ollama start：启动服务。
ollama list或ollama ls：列出本地所有可用的模型。
ollama ps：显示当前正在运行的模型列表。
ollama show [模型名称]：查看特定模型的详细信息，如模型名称、版本等。
ollama pull [模型名称]：从模型注册表中拉取一个模型到本地使用。此命令也可以用于更新本地模型，只会拉取差异部分。
ollama run [模型名称]。运行一个已安装的模型，执行某些任务。可以根据需要指定模型的参数和配置。
ollama create [模型路径]：使用包含模型信息的 [模型路径]来创建一个新模型。
ollama push [模型名称]：将本地模型推送到模型注册表中，以便他人或其他系统使用。
ollama cp [原模型名称] [新模型名称]：复制一个模型到另一个位置或给定名称的地方。
ollama rm [模型名称]：删除一个已安装的模型。
ollama -v或ollama --version：显示当前Ollama工具的版本信息。