Spring AI之JSON Schema：大模型结构化输出的标准化实践

一、大模型输出格式化的核心痛点

1.1 非结构化输出的挑战

当前大语言模型（LLM）在生成文本时存在显著的非结构化特征，其输出的自由文本格式存在三个关键问题：

（1）数据解析困难 ：应用系统难以通过编程方式可靠提取"姓名: 张三\n年龄: 25"等自由格式数据

（2）接口兼容性问题 ：REST API等标准化接口要求严格的数据结构，自然语言输出难以直接嵌入

（3）类型安全缺失：自由文本无法保证数值类型的正确性（如将年龄值输出为"二十"而非20）

1.2 典型场景示例

json 复制代码

// 期望的结构化输出
{
  "name": "张三",
  "age": 25,
  "email": "zhangsan@example.com"
}

// 大模型可能输出
"用户信息：
姓名：张三
年龄：二十五岁
联系邮箱：zhangsan@example.com"

二、结构化输出解决方案全景对比

2.1 主流技术方案

方案	原理	优点	缺点
JSON Schema	定义结构化数据规范	类型安全，支持复杂结构	学习成本较高
正则表达式	模式匹配提取数据	简单直观	维护困难，难以处理嵌套结构
模板引擎	预定义文本模板	输出格式可控	灵活性差，适配场景有限
自定义DSL	领域特定语言定义规则	高度定制化	开发成本高，生态系统薄弱
后处理Pipeline	多阶段解析处理	兼容现有输出	系统复杂度指数级增长

2.2 方案选择建议

简单场景：正则表达式（如快速抽取电话号码）
中等复杂度：模板引擎（如固定格式报告生成）
企业级应用：JSON Schema（需类型验证的API交互）
特殊领域：自定义DSL（如医疗报告结构化）

三、JSON Schema技术深度解析

3.1 核心作用机制

json 复制代码

// Schema定义示例
{
  "$schema": "https://json-schema.org/draft/2020-12/schema",
  "type": "object",
  "properties": {
    "name": {
      "type": "string",
      "minLength": 2
    },
    "age": {
      "type": "integer",
      "minimum": 0
    }
  },
  "required": ["name"]
}

核心功能维度：

类型系统：支持string/number/boolean/array等基础类型
数据约束：最小值、正则表达式、枚举值等校验规则
结构嵌套：支持无限层级的对象嵌套定义
模式组合：anyOf/allOf/oneOf等逻辑组合运算符

3.2 在AI系统中的工作原理

markdown 复制代码

[大模型] --自由文本--> [Schema校验器] --结构化JSON--> [应用系统]
           ↑               |
           └──Schema定义───┘

处理流程：
1. 用户定义输出数据的JSON Schema
2. 将Schema注入大模型提示词
3. 模型输出经Schema验证器处理
4. 返回符合规范的JSON数据

四、JSON Schema在AI领域的发展演进

4.1 关键技术里程碑

2013年：JSON Schema草案首次提出
2019年：OpenAPI 3.0正式集成JSON Schema
2021年：GPT-3等模型开始实验Schema约束输出
2022年：Azure OpenAI服务内置Schema验证功能
2023年：Spring AI框架正式支持JSON Schema集成

4.2 典型应用场景演进

早期阶段（2016-2019）：OpenAPI接口文档验证
探索阶段（2020-2021）：对话系统的意图参数提取
成熟阶段 （2022-至今）：
- 知识图谱实体关系抽取
- 企业级API的自然语言接口
- 多模态数据统一格式化

五、Spring AI集成实践示例

我在开发一个微信小程序：AI情绪日记。其中对接的AI接口希望要返回一个情绪值（1~100），然后给出一段建议。

5.2 Schema定义示例

java 复制代码

// 定义评估结果的JSON Schema结构，包含评分和建议字段，并设置分数范围及必填校验规则
        String json = "{ \"$schema\" : \"http://json-schema.org/draft-07/schema#\" , \"type\" : \"object\" , \"properties\" : { \"score\" : { \"type\" : \"number\" , \"description\" : \"评估结果的量化分数\" , \"minimum\" : 0 , \"maximum\" : 100 } , \"suggestion\" : { \"type\" : \"string\" , \"description\" : \"基于评分结果的建议\" } } , \"required\" : [ \"score\" , \"suggestion\" ] , \"additionalProperties\" : false }";
        
        // 将JSON Schema字符串解析为JsonNode对象，用于后续的结构化配置
        ObjectMapper objectMapper = new ObjectMapper();
        JsonNode schemaNode = objectMapper.readTree(json);
        
        // 配置Ollama模型参数，指定模型名称并应用之前定义的JSON Schema格式约束
        OllamaOptions options = OllamaOptions.builder()
                .model("deepseek-r1:14b")
                .format(schemaNode) // 应用JSON Schema格式约束
                .build();

5.3 服务调用示例

六、未来发展趋势展望

6.1 技术创新方向

动态Schema生成：根据自然语言描述自动生成Schema
混合验证机制：Schema验证与后处理管道结合
多模态扩展：支持图片、音频等非文本数据的结构描述