Spring AI 结构化输出详解

一、Spring AI 结构化输出的定义与核心概念

Spring AI 提供了一种强大的功能,允许开发者将大型语言模型(LLM)的输出从字符串转换为结构化格式,如 JSON、XML 或 Java 对象。这种结构化输出能力对于依赖可靠解析输出值的下游应用程序至关重要。

通过 Spring AI 的结构化输出转换器,开发者可以快速将 AI 模型的结果转换为可以传递给其他应用程序函数和方法的数据类型。转换器在 LLM 调用之前将期望的输出格式附加到 prompt 中,为模型提供生成所需输出结构的明确指导。在 LLM 调用之后,转换器获取模型的输出文本并将其转换为结构化类型的实例。

二、结构化输出的技术原理

结构化输出的技术原理可以分为以下几个关键步骤:

  1. 附加格式说明

    在 LLM 调用之前,转换器会将期望的输出格式(output format instruction)附加到 prompt 中。这些指令充当蓝图,塑造模型的响应以符合指定的格式。例如:

    text 复制代码
    Your response should be in JSON format.
    The data structure for the JSON should match this Java class: java.util.HashMap
    Do not include any explanations, only provide a RFC8259 compliant JSON response following this format without deviation.
  2. 模型生成响应

    LLM 根据 prompt 中的格式说明生成符合要求的输出。

  3. 解析与转换

    转换器获取模型的输出文本,并将其解析为结构化类型的实例。此过程涉及将原始文本输出映射到相应的结构化数据表示,如 JSON、XML 或特定于域的数据结构。

三、Spring AI 提供的转换器实现

Spring AI 提供了多种转换器实现,以满足不同的结构化输出需求:

  1. BeanOutputConverter

    • 使用指定的 Java 类(例如 Bean)或 ParameterizedTypeReference 配置。
    • 指示 AI 模型生成符合 JSON 模式的响应,随后利用 ObjectMapper 将 JSON 输出反序列化为目标类的 Java 对象实例。
  2. MapOutputConverter

    • 指导 AI 模型生成符合 RFC8259 的 JSON 响应。
    • 包含一个转换器实现,利用提供的 MessageConverter 将 JSON 负载转换为 java.util.Map<String, Object> 实例。
  3. ListOutputConverter

    • 指导 AI 模型生成逗号分隔的格式化输出。
    • 最终转换器将模型文本输出转换为 java.util.List
四、结构化输出的应用场景

结构化输出技术广泛应用于以下场景:

  1. 智能助手

    将模型输出转换为结构化数据,用于驱动智能助手的应用逻辑。

  2. 数据分析

    将模型生成的分析结果转换为结构化格式,便于后续的数据处理和可视化。

  3. 内容生成

    将模型生成的内容转换为特定的结构化格式,用于内容管理系统或自动化生成报告。

五、结构化输出的实现方式

以下是一些使用 Spring AI 结构化输出的代码示例:

1. 使用 BeanOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.BeanOutputConverter;

public class StructuredOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 定义目标类
        record ActorsFilms(String actor, List<String> movies) {}

        // 创建 BeanOutputConverter
        BeanOutputConverter<ActorsFilms> beanOutputConverter = new BeanOutputConverter<>(ActorsFilms.class);

        // 获取格式说明
        String format = beanOutputConverter.getFormat();

        // 构建 prompt
        String actor = "Tom Hanks";
        String template = """
                Generate the filmography of 5 movies for {actor}.
                {format}
                """;

        // 调用模型
        Generation generation = chatModel.call(
                new PromptTemplate(template, Map.of("actor", actor, "format", format)).create()).getResult();

        // 转换为目标类
        ActorsFilms actorsFilms = beanOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Actor: " + actorsFilms.actor());
        System.out.println("Movies: " + actorsFilms.movies());
    }
}
2. 使用 MapOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.MapOutputConverter;

import java.util.Map;

public class MapOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 创建 MapOutputConverter
        MapOutputConverter mapOutputConverter = new MapOutputConverter();

        // 构建 prompt
        String subject = "an array of numbers from 1 to 9 under their key name 'numbers'";
        String prompt = "Provide me a List of " + subject;

        // 调用模型
        Generation generation = chatModel.call(new Prompt(prompt)).getResult();

        // 转换为 Map
        Map<String, Object> result = mapOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Result: " + result);
    }
}
3. 使用 ListOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.ListOutputConverter;

import java.util.List;

public class ListOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 创建 ListOutputConverter
        ListOutputConverter listOutputConverter = new ListOutputConverter(new DefaultConversionService());

        // 构建 prompt
        String subject = "ice cream flavors";
        String prompt = "List five " + subject;

        // 调用模型
        Generation generation = chatModel.call(new Prompt(prompt)).getResult();

        // 转换为 List
        List<String> flavors = listOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Flavors: " + flavors);
    }
}
4. 使用 ChatClient 进行结构化输出
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;

public class ChatClientExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 定义目标类
        record ActorsFilms(String actor, List<String> movies) {}

        // 使用 ChatClient 转换为 ActorsFilms 对象
        ActorsFilms actorsFilms = ChatClient.create(chatModel).prompt()
                .user(u -> u.text("Generate the filmography of 5 movies for {actor}.")
                            .param("actor", "Tom Hanks"))
                .call()
                .entity(ActorsFilms.class);

        System.out.println("Actor: " + actorsFilms.actor());
        System.out.println("Movies: " + actorsFilms.movies());
    }
}
六、结构化输出的未来发展方向
  1. 多模态输出

    结合文本、图像、音频等多种模态数据,提升输出的多样性和准确性。

  2. 实时转换

    提高转换器的实时性,支持更快速的输出解析和转换。

  3. 领域特定转换

    针对特定领域(如医疗、法律)提供定制化的结构化输出转换器。

  4. 自动化优化

    通过机器学习技术自动优化转换器的性能和准确性。

七、总结

Spring AI 的结构化输出功能为开发者提供了一种强大的工具,可以将 LLM 的输出转换为结构化格式,从而满足下游应用程序的需求。通过使用 Spring AI 提供的转换器实现,开发者可以轻松地将模型输出转换为 JSON、XML 或 Java 对象,提高开发效率和应用可靠性。随着技术的不断发展,结构化输出将在更多领域发挥重要作用,为开发者提供更多智能化的解决方案。

相关推荐
白-胖-子2 小时前
深入剖析大模型在文本生成式 AI 产品架构中的核心地位
人工智能·架构
武子康2 小时前
Java-80 深入浅出 RPC Dubbo 动态服务降级:从雪崩防护到配置中心秒级生效
java·分布式·后端·spring·微服务·rpc·dubbo
想要成为计算机高手3 小时前
11. isaacsim4.2教程-Transform 树与Odometry
人工智能·机器人·自动驾驶·ros·rviz·isaac sim·仿真环境
静心问道4 小时前
InstructBLIP:通过指令微调迈向通用视觉-语言模型
人工智能·多模态·ai技术应用
宇称不守恒4.04 小时前
2025暑期—06神经网络-常见网络2
网络·人工智能·神经网络
小楓12014 小时前
醫護行業在未來會被AI淘汰嗎?
人工智能·醫療·護理·職業
YuTaoShao4 小时前
【LeetCode 热题 100】131. 分割回文串——回溯
java·算法·leetcode·深度优先
数据与人工智能律师5 小时前
数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
大数据·网络·人工智能·云计算·区块链
chenchihwen5 小时前
大模型应用班-第2课 DeepSeek使用与提示词工程课程重点 学习ollama 安装 用deepseek-r1:1.5b 分析PDF 内容
人工智能·学习
说私域5 小时前
公域流量向私域流量转化策略研究——基于开源AI智能客服、AI智能名片与S2B2C商城小程序的融合应用
人工智能·小程序