实操让Deepseek根据本地知识库进行回答

之前写了一篇本地电脑部署Deepseek的文章,有些朋友问到如何给本地的Deepseek添加知识库,于是我又找时间学习了下。
现在把我的实操过程分享一下。这个是本地部署Deepseek的教程:https://www.cnblogs.com/LaiYun/p/18695293

  • 下载安装Cherry-Studio

部署完本地Deepseek后就使用Cherry-Studio进行创建知识库,首先先下载Cherry-Studio,官网地址:https://cherry-ai.com/

我这里也提供一个百度云盘链接:https://pan.baidu.com/s/1jSD99Ls7IV6tgPJT3ZsRCg 提取码:1ba3

下载好后进行安装Cherry-Studio。

  • 下载嵌入模型BGE-M3

进入Ollama官网:https://ollama.com/search,在Models搜索**BGE**

点击进入BGE后,点击复制下载命令

打开CMD终端命令,粘贴下载命令,回车下载

  • 配置CherryStudio

打开CherryStudio客户端,点击设置-->打开Ollama-->选择模型

将Deepseek和BGE模型添加进去

  • 添加本地知识库

添加知识库,嵌入模型有多个的话自己选择一个好用的就可以,这里示例是BGE-M3

将自己的本地文件添加到知识库中,这里除了可以添加文件,还可以设置本地的文件目录或者网址、网站、笔记等作为知识库的来源。

添加好本地知识库后,开始提问,我这里的测试知识库文件是txt的,内容也很少,提问小李的电话是多少。

选好知识库后一定要变亮了才是选择上了,亮了后就回车提问。

根据我的提问,模型从本地知识库中检索回答出来了正确答案。

到了这里可能会有人很兴奋,立马心血来潮就想建立一个自己的私有知识库,等等,先别急,我再给你看下另外一个测试效果。

这里我是用的信息管理工程师的官方教材,比如:这里信息化政策法规和标准规范6个要素,我就针对这个提问

这里我已经上传好了本地文件

提问:信息化政策法规和标准规范6个要素是什么?

发现回答的和本地知识库的没有一点关联性。看到这里很多人很失望,但是原因是什么呢?

不是大模型不行,而是你部署的大模型参数太低,比如我这个测试的大模型就是最小的1.5B的,所以他的智商就在那里。我看了网上其他一些人的测试,如果要效果比较好的,就需要32B或者70B的效果就会好很多,但是也不要期待值过高,本地版始终很难和Deepseek官方那个在线那么流畅和智能,即使你是用的671B的也是一样,因为这个还是需要专业人士不断地进行一些针对性的调优和校正。

当然如果是个人或者企业在资源充足以及要求隐私性比较强的情况下还是可以在本地部署一个32B以上的进行使用的,一些简单的需求它还是可以处理的,如果是671B全参数完整版,那还是很厉害的。还有Cherry-Studio这个工具还集成了很多其他的AI模型,如果你有API的话也可以调在线模型,或者你本地电脑下载了其他模型的话,也可以进行切换对应模型,具体功能大家可以自己摸索。

最后教程就到此结束啦,谢谢!