如何给本地部署的DeepSeek投喂数据,让他更懂你

写在前面

在上一篇文章中,我们说了怎么在本地部署DeepSeek。对本地部署DeepSeek感兴趣的小伙伴看过来。
本地部署 DeepSeek:小白也能轻松搞定!

话说回来了,为啥要本地部署呢?

① 在使用DeepSeek中,经常会出现服务器繁忙,请稍后再试。

② 不想让个人隐私数据暴露出去

③ 可以将各种格式的文件,如pdf、csv、txt、md 格式的数据投喂给它。比如你想让 DeepSeek 了解你的公司业务,就把相关的文档上传给它。

DeepSeek 就能吃下你给它的各种"知识大餐",然后变得更聪明,更懂你

一、RAG是什么?

为了投喂数据,我们要用到RAG。首先,我们先来了解下什么是RAG?

我们就问问昨天部署好的DeepSeek好了。

首先我们在命令行输入:ollama run deepseek-r1:1.5b 命令,启动DeepSeek

然后打开浏览器并输入快捷键:ctrl+shift+l 调出WebUI可视化AI界面

输入:RAG是什么?

翻译成大白话就是:我们把知识放到知识库里,然后把它投喂给人工智能。我们需要用一个量化的工具,把各种格式的数据量化给人工智能,让它能看得懂。

人工智能通过对这些知识的学习后,以后你再问它的时候,他就能将知识提取出来,加工处理后回答你的问题。

RAG 就是让 DeepSeek 不仅能靠自己的知识库回答问题,还能通过检索外部数据来增强回答的准确性和丰富性。就好比你考试时偷偷带了小抄,但 DeepSeek 是光明正大地"作弊",还能把答案说得头头是道。

二、 拉取nomic-embed-text

刚说了RAG是啥?我们需要一个RAG工具来完成量化工作。

各种开源免费的RAG工具挺多,我们这里选择最近比较获得ollama 提供的nomic-embed-text

https://ollama.com/library/nomic-embed-text

我们使用上面圈出来的命令拉取即可,274M,大约1min左右就可以下完,出现【success】字样表示下载成功。

三、RAG设置

打开WebUI界面,我们会看到一个RAG设置文本嵌入模型

文本嵌入模型就是把我们投喂的各种文档数据量化成DeepSeek认识的数据。

四、添加新知识

工具都准备好后,我们开始准备给DeepSeek投喂数据......

① 投喂前不认识晓凡

在投喂数据之前,我们问问它认不认识晓凡。结果不用我说了,肯定是不知道的 😅

② 准备投喂的数据

接下来,将晓凡事先准备好的关于晓凡的简介【程序员晓凡.md】文档投喂给它,文档内容如下。

③ 投喂数据

④ 投喂完成后,已经认识晓凡了

五、其他数据投喂测试

我们准备一个【学生选课系统接口文档 V1.1.md】接口文档

按照上面方法进行投喂

接下来,我们我们让DeepSeek 用Java语言实现【获取学生选课信息】这一接口功能

本期内容到这儿就结束了,希望对您有所帮助。

我们下期再见 ヾ(•ω•`)o (●'◡'●)

相关推荐
爱笑的眼睛117 小时前
FastAPI 路由系统深度探索:超越基础 CRUD 的高级模式与架构实践
java·人工智能·python·ai
张彦峰ZYF8 小时前
AI赋能原则6解读思考:深度专业、跨界能力与工具协同的复合竞争力-AI时代的人才新逻辑
人工智能·ai·ai赋能和落地
My LQS10 小时前
RAG技术栈核心重点及其落地场景
ai
爱笑的眼睛1110 小时前
自动机器学习组件的深度解析:超越AutoML框架的底层架构
java·人工智能·python·ai
我重来不说话12 小时前
ai模型输入<think>xx返回错误
ai·报错·ai截断
TMO Group 探谋网络科技14 小时前
AI Agent工作原理:如何连接数据、决策与行动,助力企业数字化转型?
大数据·人工智能·ai
爱笑的眼睛1114 小时前
超越SIFT与ORB:深入OpenCV特征检测API的设计哲学与高阶实践
java·人工智能·python·ai
爱写Bug的小孙15 小时前
Tools、MCP 和 Function Calling
开发语言·人工智能·python·ai·ai编程·工具调用
rgb2gray15 小时前
城市韧性与交通基础设施系统耦合协调度的时空演变及影响因素
网络·人工智能·python·ai·写作·耦合·耦合协调
AI大模型学徒15 小时前
大模型应用开发(十五)_知识库1
人工智能·chatgpt·大模型·llm·知识库·deepseek