RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
Chukai1231 天前
第3章:基于LlamaIndex+Ollama+ChromaDB搭建本地简单RAG问答系统
开发语言·人工智能·python·rag·rag问答系统
enjoy编程1 天前
Spring-AI RAG 如何提高召回率?
人工智能·rag·recall·重排·召回率·rerank·hyde
Robot侠1 天前
赋予 AI 记忆:在 RTX 3090 上搭建本地 RAG 知识库问答系统
人工智能·langchain·llm·llama·qwen·rag·chromadb
摸鱼仙人~2 天前
企业级 RAG 问答系统开发上线流程分析
后端·python·rag·检索
AI-Frontiers3 天前
RAG效果差?7个指标让你的准确率大幅提升
rag
蜂蜜黄油呀土豆4 天前
RAG 的基石:文本嵌入模型与向量数据库
langchain·大语言模型·embedding·向量数据库·rag
Robot侠4 天前
视觉语言导航从入门到精通(四)
人工智能·深度学习·transformer·rag·视觉语言导航·vln
Chukai1234 天前
第1章:了解大模型与RAG
大模型·rag
Robot侠4 天前
多模态大语言模型(Multimodal LLM)技术实践指南
人工智能·语言模型·自然语言处理·transformer·rag·多模态大模型