RAG的一点思考

RAG有一个很典型的模块叫文本切块,然后检索。切块部分可以按window窗口切,检索部分也可以多路径检索,兼具稀疏检索,稠密检索和数据流检索。

这个流程和token化,然后embedding很像,所以我今天就陷入了迷茫?

因为一个RAG框架效果不好,你怎么定位是检索问题还是切块问题呢?

同学回答,其实两个很像,但是不一样,RAG切块可以大块的按照一段一页那种切,token化是按照最小语义切分,一个词或者一个字。所以定位问题时既要考虑检索,也要考虑生成。检索就要尝试可视化分块部分。

最近在学agent,hugging face的教程很不错。

相关推荐
秋名山码民15 天前
Graph RAG 深度解析:从向量检索到知识推理的技术演进
大数据·人工智能·rag
Artech15 天前
[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现
ai·agent·rag·maf
染指111015 天前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
SXJR16 天前
spring boot + langchain4j +milvus实现向量存储
java·spring boot·后端·大模型·milvus·rag·langchain4j
deephub16 天前
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类
人工智能·机器学习·kmeans·聚类·rag
四六的六16 天前
WebView里跑RAG——浏览器内知识检索增强实战
前端·实战·个人开发·webview·ai大模型·rag·webview内嵌开发
Attachment George16 天前
山东大学软件学院-项目实训-个人开发日志(十):材料问答链路开发——文档解析、OCR兜底与持续追问完善
python·ai·langchain·kotlin·rag
knight_9___16 天前
AI Agent 是什么?
人工智能·python·agent·rag·mcp
程序员三明治16 天前
【AI】从文本到向量:理解Embedding的作用
java·人工智能·后端·llm·元数据·rag·向量化
不爱洗脚的小滕16 天前
【Agent】如何为 AI Agent 设计高可用的 Tools
人工智能·aigc·ai编程·rag