【RAG】使用llamaindex进行RAG开发

岁月漫长_2025-08-28 9:21

RAG基本步骤

parse：将pdf，doc，ppt等file解析成文本，如markdown。有基本的metadata。
chunk：将markdown文本进行分块，比如按大小分，语义分等。可以为每个块添加更丰富的metadata。
index：将每个分块使用embedding model转换为向量，存储到vector db中，方便后续检索。
retrieve：将user query也用embedding model转换为向量，连接vector db进行相似度搜索，rerank等找到和query最相关的top k个块。
generate：根据上一步返回的最相关块和user query结合，调用llm进行生成。一般会有些后处理。

123步会在user上传知识库文件后执行，45步会在user对知识库进行问答时执行。

我们使用llamaindex完成rag整个过程，此外还需要：

llamaindex提供了high level的RAG实现，但是我们需要更好的灵活性，所以会用更低层的API来做

代码等忙完再整理