深入解析 Spring AI 系列:解析返回参数处理

关于普通聊天对接,目前已经完成了大部分讲解,剩下的就是最后一步,今天我们将重点讨论在返回参数时需要注意的几个关键点。为了更好地说明这些注意事项,我们仍然以OpenAI接口为例,逐步讲解相关的代码实现,帮助大家更清楚地理解这一部分的细节。

接下来,我们就直接看一下这一部分代码,分析其中的注意事项。

其实,对于这部分代码来说,核心逻辑的重点在于将大模型返回的内容封装到 response 中,从而完成对接工作。然而,值得注意的是,为什么代码中还要额外获取并处理一些看似并未直接使用的值,例如 metadatarateLimitusage 等?实际上,这并非多余的操作。这些信息虽然在当前版本的代码中并没有立即被使用,但它们的存在是为了为后续可能的需求变化做准备。

如果我们仅仅是为了简单地将获取到的返回内容输出给用户,其实是可以省去这些额外步骤的,也不需要做如此复杂的处理。如图所示:

这是Minimax算法的处理方式,相较于OpenAI的处理方式,这里采用的方法显得更加简洁和直观。因此,这部分代码的实现较为简单,理解后可以快速跳过,不必深入细节。在实际应用中,只需要在有用的地方将相应的信息提取并填充到response对象中即可。

如果某些信息在当前上下文中并未使用到,那么就不需要进行封装或处理,避免不必要的复杂度。

ChatGenerationMetadata

buildGeneration的核心逻辑其实就是在寻找需要的工具调用和结束信息,核心代码如下所示,看一下:

java 复制代码
private Generation buildGeneration(Choice choice, Map<String, Object> metadata, ChatCompletionRequest request) {
    List<AssistantMessage.ToolCall> toolCalls = choice.message().toolCalls() == null ? List.of()
            : choice.message()
                .toolCalls()
                .stream()
                .map(toolCall -> new AssistantMessage.ToolCall(toolCall.id(), "function",
                        toolCall.function().name(), toolCall.function().arguments()))
                .toList();

    String finishReason = (choice.finishReason() != null ? choice.finishReason().name() : "");
    var generationMetadataBuilder = ChatGenerationMetadata.builder().finishReason(finishReason);

    List<Media> media = new ArrayList<>();
    String textContent = choice.message().content();
    var audioOutput = choice.message().audioOutput();
    if (audioOutput != null) {
        String mimeType = String.format("audio/%s", request.audioParameters().format().name().toLowerCase());
        byte[] audioData = Base64.getDecoder().decode(audioOutput.data());
        Resource resource = new ByteArrayResource(audioData);
        Media.builder().mimeType(MimeTypeUtils.parseMimeType(mimeType)).data(resource).id(audioOutput.id()).build();
        media.add(Media.builder()
            .mimeType(MimeTypeUtils.parseMimeType(mimeType))
            .data(resource)
            .id(audioOutput.id())
            .build());
        if (!StringUtils.hasText(textContent)) {
            textContent = audioOutput.transcript();
        }
        generationMetadataBuilder.metadata("audioId", audioOutput.id());
        generationMetadataBuilder.metadata("audioExpiresAt", audioOutput.expiresAt());
    }

    var assistantMessage = new AssistantMessage(textContent, metadata, toolCalls, media);
    return new Generation(assistantMessage, generationMetadataBuilder.build());
}

无论在何种情况下省略逻辑,toolCallsfinishReason这两个要素是必须要被识别和处理的。除非某个大型模型不支持toolCalls功能,否则我们在实现时不应忽略它们。实际上,绝大多数主流的大型模型都具备这部分功能,因为如果一个模型缺失了toolCalls功能,这意味着它无法支持Agent的开发和运行,进而就失去了介入Spring AI生态系统的基本目的。总之,确保对这两个关键要素的识别,对于实现模型的有效性和功能完整性至关重要。

关于media是因为OpenAI接口是会返回此信息字段,看下接口文档:

除此之外ChatGenerationMetadata目前除了finishReason我找到了使用目的,其他的还未找到用处,ChatGenerationMetadata功能基本如下:

  1. 可以用来测试
  2. 可以用来观测
  3. 目前还没咋用上,先留个心

ChatResponseMetadata

作用也是一样的,仍然是为了观测使用,只不过他封装的信息和上面有一些区别而已。如图所示:

Usage

本质上,这只是一个用于统计token使用情况的信息,功能上并没有特别复杂的内容,理解起来并不难。如果你之前不太了解这部分的细节,可以查看它的核心代码,这将帮助你迅速掌握其工作原理。

需要注意的是,绝大多数大型模型接口都提供了类似的字段,因为在实际应用中,了解token的消耗情况非常重要,毕竟资源的投入(如费用)最终需要与使用效果相对应,这也是模型开发者和使用者关心的重点之一。如图所示:

总结

在这一部分的讲解中,我们详细探讨了返回参数处理的关键要点,特别是如何封装与使用相关的字段。尽管某些信息(如metadatarateLimit等)在当前实现中未直接用到,但它们的引入是为了更好地支持未来的扩展和需求变化。

通过对比不同处理方式,我们也看到不同模型接口在设计上的差异。在实际开发过程中,理解这些细节对于保证接口的扩展性和系统的稳定性至关重要。


我是努力的小雨,一个正经的 Java 东北服务端开发,整天琢磨着 AI 技术这块儿的奥秘。特爱跟人交流技术,喜欢把自己的心得和大家分享。还当上了腾讯云创作之星,阿里云专家博主,华为云云享专家,掘金优秀作者。各种征文、开源比赛的牌子也拿了。

💡 想把我在技术路上走过的弯路和经验全都分享出来,给你们的学习和成长带来点启发,帮一把。

🌟 欢迎关注努力的小雨,咱一块儿进步!🌟

相关推荐
努力的小雨6 天前
深入解析 Spring AI 系列:解析函数调用
ai智能
努力的小雨8 天前
深入解析 Spring AI 系列:解析OpenAI接口对接
ai智能
努力的小雨11 天前
深入解析 Spring AI 系列:以OpenAI与Moonshot案例为例寻找共同点
经验分享·ai智能
努力的小雨13 天前
深入解析 Spring AI 系列:剖析OpenAI接口接入组件
经验分享·源码分析·ai智能
努力的小雨1 个月前
教你自创工作流,赋予AI助理个性化推荐超能力
ai智能
努力的小雨1 个月前
借助AI助手快速解析LlamaIndex的Workflow设计与Java迁移
经验分享·ai智能
努力的小雨2 个月前
玩转AI工作流:一步步搭建灵活的自动化流程
ai智能