本地部署DeepSeek后的调用与删除全攻略

在本地成功部署DeepSeek模型后,如何高效调用它发挥其强大功能,以及在不需要时妥善删除,是很多用户关注的重点。我也在后台接到了很多粉丝的留言,询问 DeepSeek 本地部署之后的一些调用和删除的问题,于是我在网上找了现在主流热门的三种本地部署方案,对照他们的部署方式对出了调用和删除的指令,接下来,我们将从不同的部署方式入手,详细介绍对应的调用和删除方法。

当然你如果不了解 DeepSeek,这几篇文章会让你快速领略 DeepSeek 的风采:

热榜好文:

DeepSeek各版本说明与优缺点分析

DeepSeek-R1不同版本的 1.5B、7B、8B、14B、32B、70B、671B 主要区别以及各个蒸馏版本的优缺点

实用操作:

【大模型】深度解读 DeepSeek - R1 提示词

【大模型】DeepSeek-R1 论文原文翻译 + 解读

如何让DeepSeek成为你的私人客服:DeepSeek接入微信一文全解析

好了话不多说,接下来进入我们今天的主题环节。

一、基于Hugging Face部署的DeepSeek模型调用与删除

(一)调用方法

  1. 安装依赖 :确保已经安装transformers库,使用pip install transformers命令完成安装。如果模型运行还依赖其他特定库,如torch等,也需一并安装。

  2. 代码调用示例

python 复制代码
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型和分词器,替换为实际本地模型路径
tokenizer = AutoTokenizer.from_pretrained("your_local_deepseek_model_path")
model = AutoModelForCausalLM.from_pretrained("your_local_deepseek_model_path")

# 输入文本
input_text = "请描述一下未来城市的样子"

# 对输入文本进行编码
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# 使用模型生成文本
output = model.generate(input_ids, max_length=200, num_beams=5, early_stopping=True)

# 解码生成的文本
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)

在上述代码中,先导入所需类,接着从本地路径加载模型和分词器,然后对输入文本编码,输入模型生成文本,最后解码并输出结果 。

(二)删除方法

  1. 删除模型文件 :定位到本地部署的DeepSeek模型文件夹,直接手动删除整个文件夹。若使用的是Linux系统,可在终端中使用rm -rf your_local_deepseek_model_path命令删除;Windows系统则直接在文件资源管理器中找到对应文件夹删除。

  2. 清理缓存和依赖 :运行transformers库提供的清理缓存命令transformers-cli clear -f,清除可能残留的缓存文件。对于不再使用的相关依赖库,使用pip uninstall命令进行卸载,如pip uninstall transformers

二、通过Ollama部署的DeepSeek模型调用与删除

(一)调用方法

  1. 安装Ollama

    • Linux系统 :在终端执行curl -fsSL https://ollama.com/install.sh | sh命令完成安装。

    • 其他系统 :可前往Ollama官网(https://ollama.com/),根据对应系统下载安装包进行安装。

  2. 拉取模型 :在命令行中输入ollama run deepseek - r1:1.5b(以deepseek - r1:1.5b模型为例,可根据实际需求替换模型名称和版本),等待模型下载完成。

这里在1的位置可以更换 DeepSeek 的蒸馏模型,更换之后2的位置会出现 DeepSeek 安装指令,最后在3的位置点击复制,打开终端进行安装即可

  1. 运行模型 :模型下载完成后,执行ollama run deepseek - r1:1.5b,在命令行中即可与模型进行交互,输入问题获取回答。

(二)删除方法

  1. 删除模型 :在命令行中输入ollama rm deepseek - r1:1.5b,即可删除指定的DeepSeek模型。当然你如果还在模型的交互界面,可以先输入 Ctrl + D 来退出交互模式,ollama rm deepseek - r1:1.5b 这条语句是用来删除 deepseek - r1:1.5b 模型的,大家可以根据自己的模型来进行更改。

如果出现下面这条语句,就证明你已经成功删除了ollama rm deepseek - r1:1.5b模型。

  1. 清理缓存 :使用ollama cache clean命令,清理Ollama运行过程中产生的缓存文件,释放磁盘空间。

三、在Google Colab中部署的DeepSeek模型调用与删除

(一)调用方法

以下是在Hugging Face相关环境下关于DeepSeek模型的调用与删除方法:

调用方法

  • 使用transformers库
    • 安装依赖 :确保已经安装了transformers库、torch等相关依赖。如果没有,可使用pip install transformers torch进行安装。
    • 加载模型 :在Python代码中,使用以下方式加载DeepSeek模型。假设要加载deepseek-coder-1.3b-instruct-function-calling-v2模型,示例代码如下:
python 复制代码
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("Trelis/deepseek-coder-1.3b-instruct-function-calling-v2")
model = AutoModelForCausalLM.from_pretrained("Trelis/deepseek-coder-1.3b-instruct-function-calling-v2")
  • 生成文本:加载完模型和分词器后,就可以进行文本生成等操作,示例代码如下:
python 复制代码
input_text = "写一个简单的Python函数"
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids, max_length=100)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)
  • 使用text-generation-inference工具

    • 安装部署 :按照text-generation-inference的官方文档进行安装和部署。可以通过pip install text-generation-inference安装,然后根据提示进行配置。

    • 启动服务 :安装完成后,使用命令text-generation-server --model-id Trelis/deepseek-coder-1.3b-instruct-function-calling-v2启动服务,这里将Trelis/deepseek-coder-1.3b-instruct-function-calling-v2替换为实际要使用的DeepSeek模型名称即可。

    • 发送请求:服务启动后,可以通过HTTP请求来调用模型。示例代码如下:

python 复制代码
import requests

url = "http://localhost:8080/generate"
data = {"inputs": "请用Java写一个冒泡排序算法"}
response = requests.post(url, json=data)
print(response.json())

删除方法

  • 通过Hugging Face Hub删除

    • 登录账号 :在Hugging Face官网登录自己的账号。

    • Hugging Face官网https://huggingface.co/

    • 找到模型 :进入自己的模型仓库,找到要删除的DeepSeek模型对应的项目。

    • 删除操作:点击模型项目页面中的相关删除按钮或选项,按照提示确认删除操作。

  • 通过本地缓存删除

    • 找到缓存路径 :Hugging Face模型的缓存路径通常在~/.cache/huggingface/hub目录下。如果是Windows系统,一般在C:\Users\[用户名]\.cache\huggingface\hub
    • 删除模型文件:进入对应的模型缓存目录,删除与要删除的DeepSeek模型相关的所有文件和文件夹。

无论采用哪种方式本地部署DeepSeek模型,在调用时都要确保环境配置正确,在删除时要谨慎操作,避免误删重要文件,确保系统资源的合理管理和使用 。

相关推荐
9命怪猫1 分钟前
DeepSeek底层揭秘——微调
人工智能·深度学习·神经网络·ai·大模型
王亭_6664 分钟前
VSCode集成deepseek使用介绍(Visual Studio Code)
ide·vscode·编辑器·deepseek·openrouter
d3soft1 小时前
deepseek清华大学第二版 如何获取 DeepSeek如何赋能职场应用 PDF文档 电子档(附下载)
ai·pdf·教程·deepseek·赋能职场
kcarly1 小时前
KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度?
人工智能·语言模型·自然语言处理
Jackilina_Stone1 小时前
【论文阅读笔记】浅谈深度学习中的知识蒸馏 | 关系知识蒸馏 | CVPR 2019 | RKD
论文阅读·深度学习·蒸馏·rkd
AIGC大时代2 小时前
DeepSeek学术指南:利用DeepSeek撰写学术论文和需要注意的问题
chatgpt·学术论文·deepseek·aiwritepaper
倒霉蛋小马3 小时前
【YOLOv8】损失函数
深度学习·yolo·机器学习
MinIO官方账号3 小时前
使用 AIStor 和 OpenSearch 增强搜索功能
人工智能
江江江江江江江江江3 小时前
深度神经网络终极指南:从数学本质到工业级实现(附Keras版本代码)
人工智能·keras·dnn
Fansv5873 小时前
深度学习-2.机械学习基础
人工智能·经验分享·python·深度学习·算法·机器学习