RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
sun_tao11 天前
如何评估RAG系统的效果
人工智能·rag·ragas·rag评估
minhuan2 天前
轻量级RAG与SKILL架构深度融合:专属知识库驱动智能体精准知识匹配应用实践.138
rag·ai智能体·大模型应用·skill应用·rag+skill结合
laufing3 天前
RAG 基础版 -- 基于langchain框架
langchain·embedding·rag
凤山老林3 天前
Java 开发者零成本构建 RAG 知识库:Spring AI Alibaba + Ollama 搭建本地 RAG 知识库
java·人工智能·知识库·rag·spring ai
guslegend3 天前
4月6日(RAG系统)
人工智能·大模型·rag
Flying pigs~~3 天前
多模态RAG实战:从表格到音视频的全链路落地指南
自然语言处理·大模型·agent·多模态·rag·prompt提示词
Devin~Y3 天前
高并发内容社区实战面试:从 Java 基础到 Spring Cloud、Kafka、Redis、RAG 搜索全解析
java·spring boot·redis·spring cloud·kafka·向量数据库·rag
加油20194 天前
软件工程师知识库搭建
ai·知识库·rag
Thomas.Sir4 天前
第十三章:RAG知识库开发之【GraphRAG 从基础到实战】
python·ai·rag·graphrag