RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
北京地铁1号线10 小时前
1.4 RAG中的Schema
数据库·rag
deephub1 天前
构建自己的AI编程助手:基于RAG的上下文感知实现方案
人工智能·机器学习·ai编程·rag·ai编程助手
laplace01231 天前
claude code架构猜测总结
架构·大模型·llm·agent·rag
lkbhua莱克瓦241 天前
RAG到RGA:生成式AI的范式演进
人工智能·llm·prompt·大语言模型·rag·rga
洛阳泰山1 天前
智能体项目MaxKB4J - 本地部署与开发完整指南
java·agent·工作流·rag·智能体·maxkb
linmoo19861 天前
Langchain4j 系列之十九 - RAG之Retrieval
人工智能·langchain·retrieval·rag·langchain4j
夏日白云1 天前
《PDF解析工程实录》第 17 章|内容流里“看得见却看不见”的字符:那些幽灵文字从哪来?
pdf·llm·大语言模型·rag·文档解析
空山新雨后、2 天前
RAG:搜索引擎与大模型的完美融合
人工智能·搜索引擎·rag
dundunmm2 天前
【每天一个知识点】本体论
人工智能·rag·本体论
laplace01232 天前
agent模型基础
人工智能·语言模型·自然语言处理·agent·rag