RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
deephub2 天前
向量搜索系统的三个核心优化维度:速度、精度与规模
人工智能·python·rag·检索
海棠AI实验室3 天前
RAG 五大应用场景(三)企业级 Code RAG 与代码库 Copilot 深度架构指南
架构·copilot·rag
海棠AI实验室3 天前
RAG 五大应用场景(四)法务合同合规系统 —— 从“聊天玩具”到“证据链引擎”
rag·法务合同合规系统
deephub3 天前
RAG 中分块重叠的 8 个隐性开销与权衡策略
人工智能·大语言模型·rag·检索
无聊的小坏坏3 天前
RAG 实战 (下):打造多轮对话知识助手
langchain·rag·大模型应用
无聊的小坏坏4 天前
RAG 实战 (上):构建向量知识库
langchain·rag·大模型应用
麦麦大数据5 天前
M004_基于Langchain+RAG的银行智能客服系统设计与开发
typescript·langchain·flask·vue3·faiss·rag
小小工匠6 天前
大模型开发 - SpringAI 之高级 RAG 组件
rag·spring ai
Johnny.Cheung6 天前
面试:LLM RAG的三种算法和使用场景Reranking
llm·向量检索·rag
小楼v6 天前
⭐解锁RAG与Spring AI的实战应用(万字详细教学与完整步骤流程实践)
java·后端·rag·spring ai·ai大模型应用