spring-ai RAG(Retrieval-Augmented Generation)

目录

    • RAG概念
    • [Embedding Model & Vector Store](#Embedding Model & Vector Store)
    • [spring-ai 文本检索例子](#spring-ai 文本检索例子)
    • [Spring AI 高级RAG功能实现](#Spring AI 高级RAG功能实现)

RAG概念

Retrieval-augmented Generation,简称RAG,检索增强生成,克服大型语言模型在处理长篇内容、事实准确性和上下文感知方面的局限性。

https://docs.spring.io/spring-ai/reference/api/retrieval-augmented-generation.html

Spring AI 通过使用增强器 API(Advisor API)为常见的检索增强生成(RAG)流程提供了现成的支持。

即RAG技术给AI装上了「实时百科大脑」,通过先查资料后回答的机制,让AI摆脱传统模型的"知识遗忘"困境。

四大核心步骤:

  1. 文档切割(语义分割,大文档分割并保证语义完整) → 建立智能档案库
  2. 向量编码(Embedding) → 构建语义地图
  3. 相似检索(VectorStore) → 智能资料猎人
  4. 生成增强(将检索增强作为上下文辅助大模型回答) → 专业报告撰写

参考:https://java2ai.com/docs/1.0.0-M6.1/tutorials/rag/?spm=5176.29160081.0.0.2856aa5cWGxNNo

Embedding Model & Vector Store

Embedding是文本、图像或视频的数值表示,能够捕捉输入之间的关系,Embedding 通过将文本、图像和视频转换为称为向量(Vector)的浮点数数组来工作。这些向量旨在捕捉文本、图像和视频的含义,Embedding 数组的长度称为向量的维度。

VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它适用于处理那些经过Embedding模型转化后的数据。在 VectorStore 中,查询与传统关系数据库不同。它们执行相似性搜索,而不是精确匹配。当给定一个向量作为查询时,VectorStore 返回与查询向量"相似"的向量。

spring-ai 文本检索例子

引入依赖

xml 复制代码
<dependency>
	<groupId>org.springframework.ai</groupId>
	<artifactId>spring-ai-advisors-vector-store</artifactId>
	<version>1.0.0</version>
</dependency>

定义向量存储: 存储两个文本说明书

java 复制代码
package com.example.demo.advisor;

import org.springframework.ai.document.Document;
import org.springframework.ai.embedding.EmbeddingModel;
import org.springframework.ai.vectorstore.SimpleVectorStore;
import org.springframework.ai.vectorstore.VectorStore;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

import java.util.List;

@Configuration
public class RagConfig {

    @Bean
    VectorStore vectorStore(EmbeddingModel embeddingModel) {
        SimpleVectorStore simpleVectorStore = SimpleVectorStore
                .builder(embeddingModel)
                .build();

        // 生成一个机器人产品说明书的文档
        List<Document> documents = List.of(
                new Document("产品说明书:产品名称:科学计算器\n" +
                        "产品描述:科学计算器具备多种数学运算和工程计算功能,主要包含以下核心能力:\n" +
                        "功能:\n" +
                        "1. 数学运算:支持四则运算、三角函数(正弦、余弦、正切)、反三角函数(反正切、反余弦)、对数、指数运算等基础数学功能。部分型号如Panecal支持二进制至十六进制的数制转换。\n" +
                        "2. 存储与编辑:配备存储器(Memory)功能,可保存计算结果并随时调用,支持公式编辑与历史记录追溯。例如Panecal允许多行公式输入和实时编辑,并可通过振动反馈减少误操作。\n" +
                        "3. 单位换算:提供公制/英制等7类单位换算,包括长度、面积、体积、温度等类别,部分型号支持货币汇率转换。\n" +
                        "4. 工程师专用工具:支持开发者模式,提供二进制/十六进制转换、位运算等编程相关功能。\n")
                ,
                new Document("产品说明书:产品名称:智能机器人\n" +
                        "产品描述:智能机器人是一个智能设备,能够自动完成各种任务。\n" +
                        "功能:\n" +
                        "1. 自动导航:机器人能够自动导航到指定位置。\n" +
                        "2. 自动抓取:机器人能够自动抓取物品。\n" +
                        "3. 自动放置:机器人能够自动放置物品。\n")
        );

        simpleVectorStore.add(documents);
        return simpleVectorStore;
    }
}

使用向量存储

java 复制代码
package com.example.demo.advisor;

import org.springframework.ai.chat.client.ChatClient;
import org.springframework.ai.chat.client.advisor.RetrievalAugmentationAdvisor;
import org.springframework.ai.chat.client.advisor.api.Advisor;
import org.springframework.ai.rag.generation.augmentation.ContextualQueryAugmenter;
import org.springframework.ai.rag.retrieval.search.DocumentRetriever;
import org.springframework.ai.rag.retrieval.search.VectorStoreDocumentRetriever;
import org.springframework.ai.vectorstore.VectorStore;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class AdvisorController {

    private final ChatClient chatClient;

    public AdvisorController(ChatClient.Builder chatClientBuilder) {
        this.chatClient = chatClientBuilder
                .build();
    }

    @Autowired
    private VectorStore vectorStore;

    /**
     * http://localhost:8080/ask?userInput=科学计算器有哪些功能?
     * http://localhost:8080/ask?userInput=智能机器人有哪些功能?
     */
    @GetMapping("/ask")
    public String chat(String userInput) {
        // 4. 配置文档检索器
        DocumentRetriever retriever = VectorStoreDocumentRetriever.builder()
                .vectorStore(vectorStore)
                .similarityThreshold(0.5)    // 设置相似度阈值
                .topK(3)                     // 返回前3个最相关的文档
                .build();

        Advisor advisor = RetrievalAugmentationAdvisor.builder()
                .queryAugmenter(ContextualQueryAugmenter.builder()
                        .allowEmptyContext(true)
                        .build())
                .documentRetriever(retriever)
                .build();

        return chatClient.prompt()
                .user(userInput)
                .advisors(advisor)
                .call()
                .content();
    }

}

测试输出和说明

可以看到针对用户不同的回答,回答出了不同的产品的功能

由此可以看到基于文档数据向量,我们对用户的问题进行了增强回答

Spring AI 高级RAG功能实现

参考文档:https://java2ai.com/docs/1.0.0-M6.1/tutorials/rag/?spm=5176.29160081.0.0.2856aa5cWGxNNo#三spring-ai-高级rag功能实现