RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
weixin_422329311 小时前
企业级 RAG 系统实战详解
ai·rag
海棠AI实验室1 小时前
AI 时代文献综述:从检索到成稿的 RAG 五步法
windows·算法·自动化·llm·rag
黑马师兄17 小时前
RAG混合检索深度解析:让AI真正找到你要的内容
java·人工智能·ai·agent·rag·ai-native
小程故事多_801 天前
RAGFlow 分块策略全景与 Book 策略深度解析
java·开发语言·rag
企业知识库布道者1 天前
从 OCR 到文档结构理解:MinerU-Popo 对 RAG 文档解析链路的补全
人工智能·ocr·私有化部署·知识库·rag·企业知识库
程序员三明治1 天前
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护
人工智能·llm·知识库·元数据·rag·java后端
虎妞05002 天前
向量数据库选型指南:Milvus vs Chroma vs Weaviate
milvus·向量数据库·chroma·rag·weaviate
染指11102 天前
21.RAG进阶(Advanced RAG)-RAG存在的问题(Advanced RAG)
人工智能·rag·advanced rag
SiYuanFeng2 天前
大模型 / RAG / Agent 面试高频题
人工智能·面试·transformer·agent·rag
codefan※2 天前
Reranker 模型实战:让 RAG 检索精度再提升 20%
大模型·llm·向量数据库·rag