大模型 json格式 修复

随着大模型应用越来越多,大模型返回的json应用也增多,这些json 时不时会出现破损。 如何修复json串,成为大模型应用要处理的一个问题。

工具

在网上看到这库,试了下效果不错。这是个js库,用typescript写的,可以前端调用;也可以用pythonmonkey 在python 中调用。其原理是BNF解析器,使用解析器的规则修复json格式问题。

安装

js 复制代码
$ npm install jsonrepair

import { jsonrepair } from 'jsonrepair'
try {
const json = "{name: 'John'}"
const repaired = jsonrepair(json)
console.log(repaired) // '{"name": "John"}'
} catch (err) {
console.error(err)
}
python 复制代码
pip install pythonmonkey

import pythonmonkey
jsonrepair = pythonmonkey.require('jsonrepair').jsonrepair
json = "[1,2,3,"
repaired = jsonrepair(json)
print(repaired) 
# [1,2,3]

能修复哪些问题

  • 在缺少的键周围添加引号
  • 添加缺少的转义字符
  • 添加缺失的逗号
  • 添加缺失的右括号
  • 修复截断的 JSON
  • 将单引号替换为双引号
  • "..." 用常规双引号替换特殊引号字符
  • 用常规空格替换特殊空格字符
  • 将 Python 常量NoneTrueFalse替换为nulltruefalse
  • 删除尾随逗号
  • 删除类似/* ... */和的评论// ...
  • 带围栏的代码块,如 ```json和```````````
  • 删除数组和对象中的省略号,例如[1, 2, 3, ...]
  • 删除 JSONP 符号,例如callback({ ... })
  • 从转义字符串中去除转义字符,例如{"stringified": "content"}
  • 删除 MongoDB 数据类型,如NumberLong(2)ISODate("2012-12-19T06:01:17.171Z")
  • 连接字符串,例如"long text" + "more text on next line"
  • 将换行符分隔的 JSON 转换为有效的 JSON 数组,例如:
json 复制代码
{ "id": 1, "name": "John" }
{ "id": 2, "name": "Sarah" } 

网上demo

我测试的情况如下,// 注释,另起一行就可以修复,在同一行的就处理不了。

arduino 复制代码
{
  'firstName': 'John'
  lastName: "Smith"
  fullName: John Smith,
  // 这是一个另  
    scores: [ 7.8 6.3 7.3, ],
  "about": "John loves a challenge, "
// 这是一个另 }

处理有问题:

arduino 复制代码
{
  'firstName': 'John'
  lastName: "Smith"
  fullName: John Smith, // 这是一个另  
    scores: [ 7.8 6.3 7.3, ],
  "about": "John loves a challenge, "
// 这是一个另 }

类似库

相关推荐
viperrrrrrrrrr77 小时前
milvus向量数据库
数据库·大模型·llm·milvus
智泊AI1 天前
一文讲清:AI大模型的工作原理,它是怎么做到这么聪明的?
llm
大模型教程1 天前
告别数据隐私焦虑!用FastGPT免费私有化部署AI个人知识管理系统!
程序员·llm·agent
大模型教程1 天前
非常适合初学者的大模型应用开发教程,快速掌握 LLM 开发技能
程序员·llm·agent
AI大模型1 天前
别再乱用Embedding了!揭秘RAG系统真正灵魂的3大核心组件——90%开发者都搞错了
程序员·llm·agent
AI大模型1 天前
从零开始玩转大模型:微软的21节课带你学会大模型应用开发(附PPT)
程序员·llm·agent
爱听歌的周童鞋1 天前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 5: GPUs
llm·gpu·flashattention·cs336·tiling
爱听歌的周童鞋1 天前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts
llm·router·moe·cs336·deepseek-moe
风雨中的小七1 天前
解密prompt系列62. Agent Memory一览 - MATTS & CFGM & MIRIX
llm·nlp
AI大模型2 天前
别再瞎学大模型了,这份GitHub神级课程火爆全网(附GitHub 仓库)
程序员·llm·agent