当你爬着数据,程序突然报JSON格式化异常...(论如何修复异常的JSON)

引文

日常数据采集容易遇到异常的JSON数据,如:

括号不闭合{"profile": {"name": "xx", "age": 20}

没有引号{name: python, age: 20, salary: "python, }

反斜杠异常{"name": "python", "age": 20, "salary: "\"python\\""}

等等等等,之前基本都是使用正则匹配的方式提取关键文本,但是过于耗费时间了。

JSON-Repair

JSON-Repair是一个用于修复损坏或无效的JSON数据的库。它可以帮助你解决由于格式错误、缺失标记或其他问题导致的JSON数据无法解析的问题。

  1. 安装json-repair库:

    使用以下命令在你的Python环境中安装json-repair库:

    复制代码
    pip install json-repair
  2. 导入json-repair库:

    python 复制代码
    import json_repair
  3. 接口使用:

    json_repair提供了loads接口来加载异常数据

    python 复制代码
     invalid_json = '[{"name": "John", "age": 25}, {"name": "Mike", "age": 30]'
     repaired_json = json_repair.loads(invalid_json)
  4. 错误处理:

    如果JSON数据无法修复,repair函数将引发一个json_repair.JsonRepairError异常。你可以使用try-except语句来处理该异常并执行相应的操作。下面是一个示例代码:

    python 复制代码
    json_data = '{"name": "John", "age: 30, "city": "New York"}'
    try:
        repaired_json = json_repair.loads(json_data)
        print(repaired_json)
    except json_repair.JsonRepairError as e:
        print(f"JSON repair failed: {e}")
  5. 进一步的修复选项:

    json-repair库还提供了其他修复选项,例如指定修复级别、指定修复策略等。你可以在json_repair的文档中查找更多细节,并根据你的需求进行相应的配置。

使用案例:

  1. 解析无效的JSON数据:
python 复制代码
import json_repair

invalid_json = '[{"name": "John", "age": 25}, {"name": "Mike", "age": 30]'
parsed_data= json_repair.loads(invalid_json)
print(parsed_data)
  1. 修复缺失的JSON标记:
python 复制代码
import json_repair

missing_token_json = '{"name": "John", "age": 25, "city": "New York"}'
parsed_data= json_repair.loads(missing_token_json)
print(parsed_data)
  1. 修复格式错误的JSON数据:
python 复制代码
import json_repair

malformed_json = '{name: "John", age: 25, city: "New York"}'
parsed_data= json_repair.loads(malformed_json)
print(parsed_data)
相关推荐
汲海几秒前
Jupyter 505
ide·python·jupyter
独好紫罗兰6 分钟前
洛谷题单3-P4956 [COCI 2017 2018 #6] Davor-python-流程图重构
开发语言·python·算法
吴梓穆7 分钟前
UE5学习笔记 FPS游戏制作42 按钮添加回调函数
笔记·学习·ue5
吴梓穆11 分钟前
UE5学习笔记 FPS游戏制作39 制作一个带有背景的预制面板 使用overlay和nameSlot
笔记·学习·ue5
失去妙妙屋的米奇31 分钟前
Python与图像处理
图像处理·python·计算机视觉
yuanpan1 小时前
如何将python项目打包成Windows环境的exe应用提供给客户使用
开发语言·windows·python
程序员一诺1 小时前
【爬虫开发】爬虫开发从0到1全知识教程第14篇:scrapy爬虫框架,介绍【附代码文档】
后端·爬虫·python·数据
njsgcs1 小时前
python getattr调用当前文件引用的模块内的方法,实例
开发语言·python
独好紫罗兰1 小时前
洛谷题单3-P2669 [NOIP 2015 普及组] 金币-python-流程图重构
开发语言·python·算法
跳跳糖炒酸奶2 小时前
第四章、Isaacsim在GUI中构建机器人(3):添加摄像头和传感器
人工智能·python·算法·ubuntu·机器人