Cherry Studio搭建本地知识库,结合DeepSeek实现RAG

Cherry Studio搭建本地知识库,结合DeepSeek实现RAG

CherryStudio

CherryStudio 简介

CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。 CherryStudio 的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力。

今天就体验一下 CherryStudio 搭建本地知识库,并使用 DeepSeek 实现 RAG 功能。

环境准备

在搭建本地知识库前,需要确保以下环境准备到位:

  • 操作系统要求:支持 Windows、macOS、Linux 平台。
  • 安装 Cherry Studio
    1. 前往 Cherry Studio 官方网站 下载最新版本客户端。
    2. 按照安装向导完成部署。

模型配置

知识库需要配置嵌入模型 ,而实现 RAG 需要使用到大模型如 DeepSeek-R1,为了方便,我们可以直接使用硅基流动提供的 API 能力,毕竟点击新注册的账号有免费的 2000W Tokens 还没用完。

注册之后可以复制出来API Key,粘贴到Cherry Studio中去。

在 Cherry Studio 设置->模型服务->硅基流动,按如下顺序进行配置:

  1. 正确配置硅基流动的配置: API 地址【https://api.siliconflow.cn】和 API Key【sk-a·············bcqb】,如果有其他模型的 API Key 也可以直接选择其他模型。
  2. 选择嵌入模型 :用于向量化知识,并存入向量数据库,免费的嵌入模型可以用 BAAI/bge-m3,为了效果更好可以选择付费的 Pro/BAAI/bge-m3
  3. 选择对话模型:用于 RAG 功能实现对话,我们选择当前 DeepSeek-R1 或 DeepSeek-V3。

本地知识创建

1、新建知识库

点击 Cherry Studio 左侧知识库按钮,进入知识库管理页面,点击添加按钮新建知识库。

2、添加文件

支持拖拽添加本地文件,也可以添加本地文件目录、网址、网站或者文本。

3、添加网址或者网站

可以将网络上的内容添加到知识库中,如某一篇博客内容,也可以将一个网站进行添加,如将本人博客网站添加到知识库,需要注意的是正确填写网站的站点地图

4、搜索知识库

可以在本地知识库中进行内容搜索,能够检索到相关内容片段,这些内容片段后面通过 RAG 技术,将作为提问的上下文传给 LLM。

结合DeepSeek实现RAG

RAG (Retrieval-Augmented Generation) 是一种将信息检索和生成结合起来的技术架构。在自然语言处理领域,RAG 通过检索相关的外部知识库内容,结合生成式模型生成最终的答案,能够极大地提升模型的回答准确性和丰富性。

本地知识库的搭建则是 RAG 技术的重要部分,利用 Cherry Studio 等平台,可以便捷地实现这一过程。

1、选择知识库

进行提问之前可以选择要检索的知识库。

2、进行提问

可以看到大模型回答内容时参考了知识库中本人网站的内容:

常见问题与解决方案

Q: Cherry Studio 能否支持动态更新数据?

A: 支持。可以增量更新文档,系统会自动重建索引。

Q: 是不是需要联网才能使用?

A: 搭建本地知识库支持完全离线运行,对话模型需要联网。

Q: Cherry Studio 的检索速度如何?

自动重建索引。

Q: 是不是需要联网才能使用?

A: 搭建本地知识库支持完全离线运行,对话模型需要联网。

Q: Cherry Studio 的检索速度如何?

A: 对于中小规模知识库,其内置检索引擎性能较优。此外,结合向量化检索技术可以进一步提升速度。

相关推荐
大模型真好玩8 天前
大模型训练全流程实战指南工具篇(七)——EasyDataset文档处理流程
人工智能·langchain·deepseek
Rockbean8 天前
用40行代码搭建自己的无服务器OCR
服务器·python·deepseek
爱吃的小肥羊9 天前
DeepSeek V4 细节曝光:100 万上下文 + 原生多模态
人工智能·aigc·deepseek
deephub9 天前
向量搜索系统的三个核心优化维度:速度、精度与规模
人工智能·python·rag·检索
海棠AI实验室9 天前
RAG 五大应用场景(三)企业级 Code RAG 与代码库 Copilot 深度架构指南
架构·copilot·rag
AC赳赳老秦9 天前
云原生AI故障排查新趋势:利用DeepSeek实现高效定位部署报错与性能瓶颈
ide·人工智能·python·云原生·prometheus·ai-native·deepseek
海棠AI实验室9 天前
RAG 五大应用场景(四)法务合同合规系统 —— 从“聊天玩具”到“证据链引擎”
rag·法务合同合规系统
AI大模型..9 天前
Dify 本地部署安装教程(Windows + Docker),大模型入门到精通,收藏这篇就足够了!
人工智能·程序员·开源·llm·github·deepseek·本地化部署
deephub10 天前
RAG 中分块重叠的 8 个隐性开销与权衡策略
人工智能·大语言模型·rag·检索