如何让 GPT 输出稳定的 JSON

如何让 GPT 输出稳定的 JSON 结构是一个常见的需求,根据 @宝玉老师 的提示,发现除了用 function calling,还可以用 TypeScript 去做限制,稳定输出 JSON 结果。

比如在下面这段 prompt 中,我希望 LLM 识别用户的输入,并提取其中用户名、性别、出生日期和个人介绍,最后结果输出 JSON:

javascript 复制代码
你叫做"妙妙",是一款叫做"妙语笔记"的智能助手,接下来你会分析下面用户的输入:
"""
我的称呼是吴楷鹏,可以叫我大帅哥,出生于香港回归的那一年,生日是 3 月 13 号,喜欢上班
"""
设定:
1. 现在是 2025.10.01 21:21,时区是 Asia/Shanghai
2. 提取昵称、性别、出生日期,剩余全部信息整理成个人介绍
3. 要求输出结构化 JSON 对象,符合下面 TypeScript:
interface UserInfo {
  nickname?: string;
  gender?: 'male'  | 'female';
  dataOfBirth?: string;
  bio?: string;
}
4. 这是例子:const userInfo = {
    "nickname":"董小姐",
    "gender": "female",
    "dateOfBirth":"2001-03-07",
    "bio": "家住在长沙,喜欢做饭"
}

接下来开始分析:const userInfo=

这里使用 interface 这样的 TypeScript 语法限定输出的 JSON 对象,并且给出少量样例学习 few-shot,GPT4 稳定输出结果不带一丝废话:

javascript 复制代码
{
"nickname": "大帅哥",
"gender": "male",
"dateOfBirth": "1997-03-13",
"bio": "我叫吴楷鹏,出生于香港回归的那一年,喜欢上班。"
}

而对于 GPT3.5-turbo,测试十几轮下来,也是稳定输出 JSON 不带任何废话。

给到文心一言,输出结果带了一些杂质:

javascript 复制代码
json
{  
  "nickname": "大帅哥",  
  "gender": "male",  
  "dateOfBirth": "1997-03-13",  
  "bio": "喜欢上班"  
}```

智谱的 chatglm_pro 废话就比较多了:

javascript 复制代码
根据您提供的信息,我为您生成了一个结构化 JSON 对象:
```typescript
const userInfo = {  
 "nickname": "吴楷鹏",  
 "gender": "male",  
 "dateOfBirth": "1997-03-13",  
 "bio": "喜欢上班"  
};  
```
请注意,我在分析时发现您提到了"出生于香港回归的那一年",根据您给出的日期(3 月 13 号),这一年应该是 1997 年。因此,我在生成的 JSON 对象中,将出生日期设置为 1997-03-13。现在,这个对象符合您所提供的 TypeScript 接口要求。

讯飞星火就更离谱:

javascript 复制代码
解析:
1. 首先,我们需要从输入的文本中提取出昵称、性别、出生日期和生日。
2. 然后,我们需要将这些信息整理成一个个人介绍的文本。
3. 最后,我们需要将这个个人介绍转换为一个结构化的JSON对象。

代码如下:

```
const text = `我的称呼是吴楷鹏,可以叫我大帅哥,出生于香港回归的那一年,生日是 3 月 13 号,喜欢上班`;

// 提取昵称、性别、出生日期
const nicknameMatch = text.match(/可以叫我(.*?),/);
const genderMatch = text.match(/(.*?),/);
const birthDateMatch = text.match(/出生于(.*?),/);
const birthdayMatch = text.match(/生日是 (.*?) 号,/);

// 整理成个人介绍
let bio = "";
if (nicknameMatch) {
  bio += "昵称:" + nicknameMatch[1] + ",";
}
bio += "性别:" + genderMatch[1] + ",";
bio += "出生日期:" + birthDateMatch[1] + ",";
bio += "生日:" + birthdayMatch[1];
bio += ",";
bio += "剩余全部信息整理成个人介绍";

// 输出结构化 JSON 对象
const userInfo: UserInfo = {
  nickname: nicknameMatch && nicknameMatch[1] || "",
  gender: genderMatch && genderMatch[1] || "",
  dataOfBirth: birthDateMatch && birthDateMatch[1] || "",
  bio: bio,
};
console.log(userInfo);
```

国产大模型任重而道远。

👉 博客地址:如何让 GPT 输出稳定的 JSON 👉 公众号:程序员楷鹏

相关推荐
新加坡内哥谈技术1 小时前
Mistral推出“Le Chat”,对标ChatGPT
人工智能·chatgpt
nbsaas-boot2 小时前
如何利用ChatGPT加速开发与学习:以BPMN编辑器为例
学习·chatgpt·编辑器
hunteritself18 小时前
ChatGPT高级语音模式正在向Web网页端推出!
人工智能·gpt·chatgpt·openai·语音识别
Doker 多克20 小时前
Spring AI 框架使用的核心概念
人工智能·spring·chatgpt
曼城周杰伦1 天前
自然语言处理:第六十二章 KAG 超越GraphRAG的图谱框架
人工智能·pytorch·神经网络·自然语言处理·chatgpt·nlp·gpt-3
爱技术的小伙子1 天前
【ChatGPT】ChatGPT在多领域知识整合中的应用
chatgpt
学习前端的小z1 天前
【AIGC】如何准确引导ChatGPT,实现精细化GPTs指令生成
人工智能·gpt·chatgpt·aigc
段传涛2 天前
LLM( Large Language Models)典型应用介绍 1 -ChatGPT Large language models
人工智能·语言模型·chatgpt
起名字真南2 天前
【C++】深入理解 C++ 中的继承进阶:多继承、菱形继承及其解决方案
java·jvm·c++·chatgpt·aigc
爱技术的小伙子2 天前
【ChatGPT】如何通过角色扮演让ChatGPT回答更贴合实际场景
人工智能·chatgpt