SpringAI RAG 检索增强生成

SpringAI RAG 检索增强生成

  • [1. 文档](#1. 文档)
  • [2. 实现](#2. 实现)

1. 文档

https://docs.spring.io/spring-ai/reference/api/retrieval-augmented-generation.html

2. 实现

java 复制代码
//4.RAG
//1.用户提示词压缩,多轮对话中捕捉用户真实意图(大模型温度要低)
//2.用户提示词重写,澄清用户意图(大模型温度要低)
//3.用户提示词扩展,从多个角度捕捉用户意图
//4.文档检索(可以多源检索、元数据过滤、稠密&稀疏检索)
//5.文档合并,将多个文档源的文档合并
//6.重排序并移除低相关文档,压缩文档,满足大模型上下文窗口
//7.上下文生成
//8.允许大模型使用工具继续检索
FilterExpressionBuilder filterExpressionBuilder = new FilterExpressionBuilder();
RetrievalAugmentationAdvisor retrievalAugmentationAdvisor = RetrievalAugmentationAdvisor.builder()
    .queryTransformers(
        List.of(
            // 1. 提示词压缩
            CompressionQueryTransformer.builder().chatClientBuilder(ragChatClient.mutate()).build(),
            // 2. 提示词重写
            RewriteQueryTransformer.builder().chatClientBuilder(ragChatClient.mutate()).build()
        )
    )
    // 3. 提示词扩展
    .queryExpander(
        MultiQueryExpander.builder().chatClientBuilder(ragChatClient.mutate()).numberOfQueries(3).includeOriginal(true).build()
    )
    // 4. 文档检索
    .documentRetriever(
        VectorStoreDocumentRetriever.builder()
            .similarityThreshold(0.5)
            .topK(10)
            .filterExpression(
                filterExpressionBuilder.and(
                    filterExpressionBuilder.eq("tenantId", tenantId),
                    filterExpressionBuilder.eq("orgId", PBSContext.getUserContext().getUserModel().getCoId())
                ).build()
            )
            .vectorStore(vectorStore)
            .build()
    )
    // 5. 文档合并
    .documentJoiner(new ConcatenationDocumentJoiner())
    // 6. 重排序并移除低相关文档
    .documentPostProcessors(
        RerankerDocumentPostProcessor.builder().rerankModel(rerankModel).build()
    )
    // 7. 上下文生成
    .queryAugmenter(ContextualQueryAugmenter.builder()
        // 默认情况下,ContextualQueryAugmenter 不允许检索到的上下文为空。当发生这种情况时,它会指示模型不要回答用户查询。
        // 若启用 allowEmptyContext 选项,则允许模型在检索到的上下文为空时生成响应
        .allowEmptyContext(Boolean.TRUE)
        .build())
    .build();
相关推荐
canonical_entropy9 小时前
Harness Engineering 之外:从非线性动力系统控制理解吸引子引导工程
架构·aigc·ai编程
ServBay11 小时前
月之暗面 Kimi Code 0.4.0 发布,终端 AI 编码助手全面采用 TypeScript,实现毫秒级启动
后端·aigc·ai编程
心疼你的一切11 小时前
高效内容生产:如何实现规模化创作
大数据·人工智能·ai·ai编程·ai写作
kyriewen12 小时前
我关掉了Copilot:因为我写的代码出现在了别人的建议里
前端·javascript·ai编程
孟健12 小时前
flomo MCP 之后,笔记管理该重做了
ai编程
1点东西12 小时前
Codex + 智谱 GLM 完整跑通教程 (全网唯一测试通过教程)
aigc·openai·ai编程
颜进强13 小时前
Claude Code -8 Skills 实战指南:让 AI 精准执行你的工程规范
ai编程
ZzT13 小时前
Harness 怎么扩展:skill、配置目录与 hook
openai·ai编程·claude
小村儿15 小时前
连载11- Claude code 的 Agent Teams——当子 Agent 开始互相说话
前端·后端·ai编程
@我们的天空15 小时前
Claude Code + GLM-5 深度赋能测试:开发 8 大 Skill 构建 AI 测试助手集群
人工智能·python·测试工具·自动化·ai编程