SpringAI RAG 检索增强生成

SpringAI RAG 检索增强生成

  • [1. 文档](#1. 文档)
  • [2. 实现](#2. 实现)

1. 文档

https://docs.spring.io/spring-ai/reference/api/retrieval-augmented-generation.html

2. 实现

java 复制代码
//4.RAG
//1.用户提示词压缩,多轮对话中捕捉用户真实意图(大模型温度要低)
//2.用户提示词重写,澄清用户意图(大模型温度要低)
//3.用户提示词扩展,从多个角度捕捉用户意图
//4.文档检索(可以多源检索、元数据过滤、稠密&稀疏检索)
//5.文档合并,将多个文档源的文档合并
//6.重排序并移除低相关文档,压缩文档,满足大模型上下文窗口
//7.上下文生成
//8.允许大模型使用工具继续检索
FilterExpressionBuilder filterExpressionBuilder = new FilterExpressionBuilder();
RetrievalAugmentationAdvisor retrievalAugmentationAdvisor = RetrievalAugmentationAdvisor.builder()
    .queryTransformers(
        List.of(
            // 1. 提示词压缩
            CompressionQueryTransformer.builder().chatClientBuilder(ragChatClient.mutate()).build(),
            // 2. 提示词重写
            RewriteQueryTransformer.builder().chatClientBuilder(ragChatClient.mutate()).build()
        )
    )
    // 3. 提示词扩展
    .queryExpander(
        MultiQueryExpander.builder().chatClientBuilder(ragChatClient.mutate()).numberOfQueries(3).includeOriginal(true).build()
    )
    // 4. 文档检索
    .documentRetriever(
        VectorStoreDocumentRetriever.builder()
            .similarityThreshold(0.5)
            .topK(10)
            .filterExpression(
                filterExpressionBuilder.and(
                    filterExpressionBuilder.eq("tenantId", tenantId),
                    filterExpressionBuilder.eq("orgId", PBSContext.getUserContext().getUserModel().getCoId())
                ).build()
            )
            .vectorStore(vectorStore)
            .build()
    )
    // 5. 文档合并
    .documentJoiner(new ConcatenationDocumentJoiner())
    // 6. 重排序并移除低相关文档
    .documentPostProcessors(
        RerankerDocumentPostProcessor.builder().rerankModel(rerankModel).build()
    )
    // 7. 上下文生成
    .queryAugmenter(ContextualQueryAugmenter.builder()
        // 默认情况下,ContextualQueryAugmenter 不允许检索到的上下文为空。当发生这种情况时,它会指示模型不要回答用户查询。
        // 若启用 allowEmptyContext 选项,则允许模型在检索到的上下文为空时生成响应
        .allowEmptyContext(Boolean.TRUE)
        .build())
    .build();
相关推荐
月亮给我抄代码2 小时前
Superpowers —— 让 AI 编程代理具备工程化开发能力
驱动开发·ai编程·codex·claude code·opencode·superpowers
gyx_这个杀手不太冷静2 小时前
大人工智能时代下前端界面全新开发模式的思考(一)
前端·人工智能·ai编程
财经资讯数据_灵砚智能2 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月11日
大数据·人工智能·python·信息可视化·自然语言处理·ai编程
组合缺一3 小时前
SolonCode CLI v2026.4.11 发布(中文驱动的编码智能体)
java·ai编程·agents·solon-ai·claudecode·opencode·soloncode
刀法如飞4 小时前
关于AI的三个核心问题——工具、认知与产业的再思考
人工智能·aigc·ai编程
超低空12 小时前
OpenClaw Windows 安装详细教程
人工智能·程序员·ai编程
恋猫de小郭12 小时前
你的代理归我了:AI 大模型恶意中间人攻击,钱包都被转走了
前端·人工智能·ai编程
土豆125012 小时前
AI 编程可维护性技能实战:让 AI 成为你的代码质量守门员
llm·ai编程
F_U_N_15 小时前
效率提升80%:AI全流程研发真实项目落地复盘
人工智能·ai编程