Spring AI 结构化输出详解

一、Spring AI 结构化输出的定义与核心概念

Spring AI 提供了一种强大的功能,允许开发者将大型语言模型(LLM)的输出从字符串转换为结构化格式,如 JSON、XML 或 Java 对象。这种结构化输出能力对于依赖可靠解析输出值的下游应用程序至关重要。

通过 Spring AI 的结构化输出转换器,开发者可以快速将 AI 模型的结果转换为可以传递给其他应用程序函数和方法的数据类型。转换器在 LLM 调用之前将期望的输出格式附加到 prompt 中,为模型提供生成所需输出结构的明确指导。在 LLM 调用之后,转换器获取模型的输出文本并将其转换为结构化类型的实例。

二、结构化输出的技术原理

结构化输出的技术原理可以分为以下几个关键步骤:

  1. 附加格式说明

    在 LLM 调用之前,转换器会将期望的输出格式(output format instruction)附加到 prompt 中。这些指令充当蓝图,塑造模型的响应以符合指定的格式。例如:

    text 复制代码
    Your response should be in JSON format.
    The data structure for the JSON should match this Java class: java.util.HashMap
    Do not include any explanations, only provide a RFC8259 compliant JSON response following this format without deviation.
  2. 模型生成响应

    LLM 根据 prompt 中的格式说明生成符合要求的输出。

  3. 解析与转换

    转换器获取模型的输出文本,并将其解析为结构化类型的实例。此过程涉及将原始文本输出映射到相应的结构化数据表示,如 JSON、XML 或特定于域的数据结构。

三、Spring AI 提供的转换器实现

Spring AI 提供了多种转换器实现,以满足不同的结构化输出需求:

  1. BeanOutputConverter

    • 使用指定的 Java 类(例如 Bean)或 ParameterizedTypeReference 配置。
    • 指示 AI 模型生成符合 JSON 模式的响应,随后利用 ObjectMapper 将 JSON 输出反序列化为目标类的 Java 对象实例。
  2. MapOutputConverter

    • 指导 AI 模型生成符合 RFC8259 的 JSON 响应。
    • 包含一个转换器实现,利用提供的 MessageConverter 将 JSON 负载转换为 java.util.Map<String, Object> 实例。
  3. ListOutputConverter

    • 指导 AI 模型生成逗号分隔的格式化输出。
    • 最终转换器将模型文本输出转换为 java.util.List
四、结构化输出的应用场景

结构化输出技术广泛应用于以下场景:

  1. 智能助手

    将模型输出转换为结构化数据,用于驱动智能助手的应用逻辑。

  2. 数据分析

    将模型生成的分析结果转换为结构化格式,便于后续的数据处理和可视化。

  3. 内容生成

    将模型生成的内容转换为特定的结构化格式,用于内容管理系统或自动化生成报告。

五、结构化输出的实现方式

以下是一些使用 Spring AI 结构化输出的代码示例:

1. 使用 BeanOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.BeanOutputConverter;

public class StructuredOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 定义目标类
        record ActorsFilms(String actor, List<String> movies) {}

        // 创建 BeanOutputConverter
        BeanOutputConverter<ActorsFilms> beanOutputConverter = new BeanOutputConverter<>(ActorsFilms.class);

        // 获取格式说明
        String format = beanOutputConverter.getFormat();

        // 构建 prompt
        String actor = "Tom Hanks";
        String template = """
                Generate the filmography of 5 movies for {actor}.
                {format}
                """;

        // 调用模型
        Generation generation = chatModel.call(
                new PromptTemplate(template, Map.of("actor", actor, "format", format)).create()).getResult();

        // 转换为目标类
        ActorsFilms actorsFilms = beanOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Actor: " + actorsFilms.actor());
        System.out.println("Movies: " + actorsFilms.movies());
    }
}
2. 使用 MapOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.MapOutputConverter;

import java.util.Map;

public class MapOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 创建 MapOutputConverter
        MapOutputConverter mapOutputConverter = new MapOutputConverter();

        // 构建 prompt
        String subject = "an array of numbers from 1 to 9 under their key name 'numbers'";
        String prompt = "Provide me a List of " + subject;

        // 调用模型
        Generation generation = chatModel.call(new Prompt(prompt)).getResult();

        // 转换为 Map
        Map<String, Object> result = mapOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Result: " + result);
    }
}
3. 使用 ListOutputConverter
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;
import com.alibaba.cloud.ai.client.output.ListOutputConverter;

import java.util.List;

public class ListOutputExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 创建 ListOutputConverter
        ListOutputConverter listOutputConverter = new ListOutputConverter(new DefaultConversionService());

        // 构建 prompt
        String subject = "ice cream flavors";
        String prompt = "List five " + subject;

        // 调用模型
        Generation generation = chatModel.call(new Prompt(prompt)).getResult();

        // 转换为 List
        List<String> flavors = listOutputConverter.convert(generation.getOutput().getContent());

        System.out.println("Flavors: " + flavors);
    }
}
4. 使用 ChatClient 进行结构化输出
java 复制代码
import com.alibaba.cloud.ai.client.ChatClient;
import com.alibaba.cloud.ai.client.model.ChatModel;

public class ChatClientExample {

    public static void main(String[] args) {
        ChatModel chatModel = ChatModel.create("your-model-id");

        // 定义目标类
        record ActorsFilms(String actor, List<String> movies) {}

        // 使用 ChatClient 转换为 ActorsFilms 对象
        ActorsFilms actorsFilms = ChatClient.create(chatModel).prompt()
                .user(u -> u.text("Generate the filmography of 5 movies for {actor}.")
                            .param("actor", "Tom Hanks"))
                .call()
                .entity(ActorsFilms.class);

        System.out.println("Actor: " + actorsFilms.actor());
        System.out.println("Movies: " + actorsFilms.movies());
    }
}
六、结构化输出的未来发展方向
  1. 多模态输出

    结合文本、图像、音频等多种模态数据,提升输出的多样性和准确性。

  2. 实时转换

    提高转换器的实时性,支持更快速的输出解析和转换。

  3. 领域特定转换

    针对特定领域(如医疗、法律)提供定制化的结构化输出转换器。

  4. 自动化优化

    通过机器学习技术自动优化转换器的性能和准确性。

七、总结

Spring AI 的结构化输出功能为开发者提供了一种强大的工具,可以将 LLM 的输出转换为结构化格式,从而满足下游应用程序的需求。通过使用 Spring AI 提供的转换器实现,开发者可以轻松地将模型输出转换为 JSON、XML 或 Java 对象,提高开发效率和应用可靠性。随着技术的不断发展,结构化输出将在更多领域发挥重要作用,为开发者提供更多智能化的解决方案。

相关推荐
敖云岚1 分钟前
【AI】SpringAI 第一弹:SpringAI 的兴起介绍
人工智能
后端小肥肠7 分钟前
MCP协议实战指南:在VS Code中实现PostgreSQL到Excel的自动化迁移
人工智能·ai·aigc
Massage0hi7 分钟前
食药类实验室信息管理系统
java
是Dream呀9 分钟前
从传统卷积到空洞卷积:PAMAP2数据集上的多模态行为识别探索
人工智能
果冻人工智能12 分钟前
LLM 的注意力黑洞:为什么第一个 Token 吸走了所有注意力?
人工智能
意.远12 分钟前
批量归一化(Batch Normalization)原理与PyTorch实现
人工智能·pytorch·python·深度学习·神经网络·分类·batch
掘金安东尼18 分钟前
DeepSeek-R1 全托管无服务器上线亚马逊云 Bedrock,为何值得关注?
人工智能·llm
Love绘梨衣的Mr.lu19 分钟前
【benepar】benepar安装会自动更新pytorch
人工智能·pytorch·python
ApeAssistant21 分钟前
Spring EL表达式 抽象到极致的艺术品
spring