Spring AI 结构化输出详解

一、Spring AI 结构化输出的定义与核心概念

Spring AI 提供了一种强大的功能,允许开发者将大型语言模型(LLM)的输出从字符串转换为结构化格式,如 JSON、XML 或 Java 对象。这种结构化输出能力对于依赖可靠解析输出值的下游应用程序至关重要。

通过 Spring AI 的结构化输出转换器,开发者可以快速将 AI 模型的结果转换为可以传递给其他应用程序函数和方法的数据类型。转换器在 LLM 调用之前将期望的输出格式附加到 prompt 中,为模型提供生成所需输出结构的明确指导。在 LLM 调用之后,转换器获取模型的输出文本并将其转换为结构化类型的实例。

二、结构化输出的技术原理

结构化输出的技术原理可以分为以下几个关键步骤:

  1. 附加格式说明

    在 LLM 调用之前,转换器会将期望的输出格式(output format instruction)附加到 prompt 中。这些指令充当蓝图,塑造模型的响应以符合指定的格式。例如:

    text 复制代码
    Your response should be in JSON format.
    The data structure for the JSON should match this Java class: java.util.HashMap
    Do not include any explanations, only provide a RFC8259 compliant JSON response following this format without deviation.
  2. 模型生成响应

    LLM 根据 prompt 中的格式说明生成符合要求的输出。

  3. 解析与转换

    转换器获取模型的输出文本,并将其解析为结构化类型的实例。此过程涉及将原始文本输出映射到相应的结构化数据表示,如 JSON、XML 或特定于域的数据结构。

三、Spring AI 提供的转换器实现

Spring AI 提供了多种转换器实现,以满足不同的结构化输出需求:

  1. BeanOutputConverter

    • 使用指定的 Java 类(例如 Bean)或 ParameterizedTypeReference 配置。
    • 指示 AI 模型生成符合 JSON 模式的响应,随后利用 ObjectMapper 将 JSON 输出反序列化为目标类的 Java 对象实例。
  2. MapOutputConverter

    • 指导 AI 模型生成符合 RFC8259 的 JSON 响应。
    • 包含一个转换器实现,利用提供的 MessageConverter 将 JSON 负载转换为 java.util.Map<String, Object> 实例。
  3. ListOutputConverter

    • 指导 AI 模型生成逗号分隔的格式化输出。
    • 最终转换器将模型文本输出转换为 java.util.List
四、结构化输出的应用场景

结构化输出技术广泛应用于以下场景:

  1. 智能助手

    将模型输出转换为结构化数据,用于驱动智能助手的应用逻辑。

  2. 数据分析

    将模型生成的分析结果转换为结构化格式,便于后续的数据处理和可视化。

  3. 内容生成

    将模型生成的内容转换为特定的结构化格式,用于内容管理系统或自动化生成报告。

五、结构化输出的实现方式

以下是一些使用 Spring AI 结构化输出的代码示例:

1. 使用 BeanOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.BeanOutputConverter;

public class StructuredOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 定义目标类
        record ActorsFilms(String actor, List<String> movies) {}

        // 创建 BeanOutputConverter
        BeanOutputConverter<ActorsFilms> beanOutputConverter = new BeanOutputConverter<>(ActorsFilms.class);

        // 获取格式说明
        String format = beanOutputConverter.getFormat();

        // 构建 prompt
        String actor = "Tom Hanks";
        String template = """
                Generate the filmography of 5 movies for {actor}.
                {format}
                """;

        // 调用模型
        Generation generation = chatModel.call(
                new PromptTemplate(template, Map.of("actor", actor, "format", format)).create()).getResult();

        // 转换为目标类
        ActorsFilms actorsFilms = beanOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Actor: " + actorsFilms.actor());
        System.out.println("Movies: " + actorsFilms.movies());
    }
}
2. 使用 MapOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.MapOutputConverter;

import java.util.Map;

public class MapOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 创建 MapOutputConverter
        MapOutputConverter mapOutputConverter = new MapOutputConverter();

        // 构建 prompt
        String subject = "an array of numbers from 1 to 9 under their key name 'numbers'";
        String prompt = "Provide me a List of " + subject;

        // 调用模型
        Generation generation = chatModel.call(new Prompt(prompt)).getResult();

        // 转换为 Map
        Map<String, Object> result = mapOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Result: " + result);
    }
}
3. 使用 ListOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.ListOutputConverter;

import java.util.List;

public class ListOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 创建 ListOutputConverter
        ListOutputConverter listOutputConverter = new ListOutputConverter(new DefaultConversionService());

        // 构建 prompt
        String subject = "ice cream flavors";
        String prompt = "List five " + subject;

        // 调用模型
        Generation generation = chatModel.call(new Prompt(prompt)).getResult();

        // 转换为 List
        List<String> flavors = listOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Flavors: " + flavors);
    }
}
4. 使用 ChatClient 进行结构化输出
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;

public class ChatClientExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 定义目标类
        record ActorsFilms(String actor, List<String> movies) {}

        // 使用 ChatClient 转换为 ActorsFilms 对象
        ActorsFilms actorsFilms = ChatClient.create(chatModel).prompt()
                .user(u -> u.text("Generate the filmography of 5 movies for {actor}.")
                            .param("actor", "Tom Hanks"))
                .call()
                .entity(ActorsFilms.class);

        System.out.println("Actor: " + actorsFilms.actor());
        System.out.println("Movies: " + actorsFilms.movies());
    }
}
六、结构化输出的未来发展方向
  1. 多模态输出

    结合文本、图像、音频等多种模态数据,提升输出的多样性和准确性。

  2. 实时转换

    提高转换器的实时性,支持更快速的输出解析和转换。

  3. 领域特定转换

    针对特定领域(如医疗、法律)提供定制化的结构化输出转换器。

  4. 自动化优化

    通过机器学习技术自动优化转换器的性能和准确性。

七、总结

Spring AI 的结构化输出功能为开发者提供了一种强大的工具,可以将 LLM 的输出转换为结构化格式,从而满足下游应用程序的需求。通过使用 Spring AI 提供的转换器实现,开发者可以轻松地将模型输出转换为 JSON、XML 或 Java 对象,提高开发效率和应用可靠性。随着技术的不断发展,结构化输出将在更多领域发挥重要作用,为开发者提供更多智能化的解决方案。

相关推荐
明湖起风了4 小时前
mqtt消费堆积
java·jvm·windows
Free Tester4 小时前
如何判断 LeakCanary 报告的严重程度
java·jvm·算法
让学习成为一种生活方式4 小时前
海洋类胡萝卜素生物合成的乙酰转移酶--文献精读217
人工智能
QQ676580084 小时前
服装计算机视觉数据集 连衣裙数据集 衣服类别识别 毛衣数据集 夹克衫AI识别 衬衫识别 裤子 数据集 yolo格式数据集
人工智能·yolo·计算机视觉·连衣裙·衣服类别·毛衣数据集·夹克衫ai
冰糖葫芦三剑客4 小时前
人工智能生成合成内容文件元数据隐式标识说明函要怎么填写
人工智能
清心歌5 小时前
CopyOnWriteArrayList 实现原理
java·开发语言
CV-杨帆5 小时前
ICLR 2026 LLM安全相关论文整理
人工智能·深度学习·安全
田八5 小时前
聊聊AI的发展史,AI的爆发并不是偶然
前端·人工智能·程序员
zandy10115 小时前
全链路可控+极致性能,衡石HENGSHI CLI重新定义企业级BI工具的AI协作能力
大数据·人工智能·ai analytics·ai native·agent-first
广州灵眸科技有限公司5 小时前
为RK3588注入澎湃算力:RK1820 AI加速卡完整适配与评测指南
linux·网络·人工智能·物联网·算法