Cherry Studio搭建本地知识库,结合DeepSeek实现RAG

Cherry Studio搭建本地知识库,结合DeepSeek实现RAG

CherryStudio

CherryStudio 简介

CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。 CherryStudio 的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力。

今天就体验一下 CherryStudio 搭建本地知识库,并使用 DeepSeek 实现 RAG 功能。

环境准备

在搭建本地知识库前,需要确保以下环境准备到位:

  • 操作系统要求:支持 Windows、macOS、Linux 平台。
  • 安装 Cherry Studio
    1. 前往 Cherry Studio 官方网站 下载最新版本客户端。
    2. 按照安装向导完成部署。

模型配置

知识库需要配置嵌入模型 ,而实现 RAG 需要使用到大模型如 DeepSeek-R1,为了方便,我们可以直接使用硅基流动提供的 API 能力,毕竟点击新注册的账号有免费的 2000W Tokens 还没用完。

注册之后可以复制出来API Key,粘贴到Cherry Studio中去。

在 Cherry Studio 设置->模型服务->硅基流动,按如下顺序进行配置:

  1. 正确配置硅基流动的配置: API 地址【https://api.siliconflow.cn】和 API Key【sk-a·············bcqb】,如果有其他模型的 API Key 也可以直接选择其他模型。
  2. 选择嵌入模型 :用于向量化知识,并存入向量数据库,免费的嵌入模型可以用 BAAI/bge-m3,为了效果更好可以选择付费的 Pro/BAAI/bge-m3
  3. 选择对话模型:用于 RAG 功能实现对话,我们选择当前 DeepSeek-R1 或 DeepSeek-V3。

本地知识创建

1、新建知识库

点击 Cherry Studio 左侧知识库按钮,进入知识库管理页面,点击添加按钮新建知识库。

2、添加文件

支持拖拽添加本地文件,也可以添加本地文件目录、网址、网站或者文本。

3、添加网址或者网站

可以将网络上的内容添加到知识库中,如某一篇博客内容,也可以将一个网站进行添加,如将本人博客网站添加到知识库,需要注意的是正确填写网站的站点地图

4、搜索知识库

可以在本地知识库中进行内容搜索,能够检索到相关内容片段,这些内容片段后面通过 RAG 技术,将作为提问的上下文传给 LLM。

结合DeepSeek实现RAG

RAG (Retrieval-Augmented Generation) 是一种将信息检索和生成结合起来的技术架构。在自然语言处理领域,RAG 通过检索相关的外部知识库内容,结合生成式模型生成最终的答案,能够极大地提升模型的回答准确性和丰富性。

本地知识库的搭建则是 RAG 技术的重要部分,利用 Cherry Studio 等平台,可以便捷地实现这一过程。

1、选择知识库

进行提问之前可以选择要检索的知识库。

2、进行提问

可以看到大模型回答内容时参考了知识库中本人网站的内容:

常见问题与解决方案

Q: Cherry Studio 能否支持动态更新数据?

A: 支持。可以增量更新文档,系统会自动重建索引。

Q: 是不是需要联网才能使用?

A: 搭建本地知识库支持完全离线运行,对话模型需要联网。

Q: Cherry Studio 的检索速度如何?

自动重建索引。

Q: 是不是需要联网才能使用?

A: 搭建本地知识库支持完全离线运行,对话模型需要联网。

Q: Cherry Studio 的检索速度如何?

A: 对于中小规模知识库,其内置检索引擎性能较优。此外,结合向量化检索技术可以进一步提升速度。

相关推荐
精致先生3 小时前
RAG(检索增强生成)
人工智能·大模型·rag
青梅主码8 小时前
Artificial Analysis《2025年上半年人工智能应用报告》Google、xAI、DeepSeek崛起,大模型洗牌
aigc·ai编程·deepseek
GEM的左耳返11 小时前
Java AI面试实战:Spring AI与RAG技术落地
prompt工程·向量数据库·java面试·rag·ai应用·spring ai
在未来等你20 小时前
RAG实战指南 Day 24:上下文构建与提示工程
nlp·rag·retrieval-augmented generation·prompt engineering·context management
charlee4421 小时前
PandasAI连接LLM进行智能数据分析
ai·数据分析·llm·pandasai·deepseek
deephub1 天前
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
人工智能·深度学习·神经网络·langchain·大语言模型·rag
真就死难1 天前
Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理
人工智能·机器学习·rag
FIT2CLOUD飞致云2 天前
七月月报丨MaxKB在企业环境中实现AI落地的具体场景盘点
人工智能·开源·deepseek
缘友一世2 天前
ReAct Agent(LangGraph实现)
rag·langgraph
陈佬昔没带相机2 天前
Dify MCP功能实测,小参数模型竟然全军覆没!
ollama·deepseek·mcp