RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
abigale032 小时前
LangChain:自定义模型・RAG 检索・Agent 原理笔记
langchain·llm·prompt·agent·rag·lcel
从零开始学习人工智能1 天前
量化评估RAG效果:LLM答案自动评估脚本全解析
人工智能·多模态·rag
ん贤1 天前
如何设计Agent的记忆模块
agent·rag·记忆机制
guslegend2 天前
第17节:模型忽略关键实体怎么办?注意力权重分配机制引导生成拒绝重点
人工智能·大模型·rag
Thanks_ks2 天前
从辅助编码到架构重塑:基于 LLM 的智能开发工作流落地实战
自动化测试·大模型·llm·研发效能·模型微调·rag·提示词工程
wuxinyan1232 天前
Java面试题53:一文深入了解RAG(检索增强生成)核心概念
java·人工智能·机器学习·面试·rag
knight_9___3 天前
LLM工具调用面试篇2
人工智能·python·深度学习·机器学习·agent·rag
庄小焱3 天前
【AI模型】——RAG格式集成
大模型·rag·ai模型·模型结果格式化
.柒宇.3 天前
LangChain入门教程
ai·langchain·llm·agent·rag
庄小焱3 天前
【AI模型】——基于知识图谱的RAG
人工智能·大模型·知识图谱·rag·ai模型·ai系统