JSON 数据格式详解

1. JSON 概念

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式:

  • 人类可读的文本格式
  • 完全独立于编程语言
  • 用于存储和传输结构化数据
  • 广泛应用于API通信、配置文件和数据存储

2. JSON 核心原理

  • 键值对结构:类似字典的概念
  • 树状层级:支持嵌套数据结构
  • 数据类型支持:字符串、数字、布尔值、数组、对象、null
  • 无状态:不包含函数或可执行代码
  • 文本格式:使用纯文本表示,默认UTF-8编码

3. JSON 语法规范

基本结构

json 复制代码
{
  "key1": "value",
  "key2": 42,
  "key3": true,
  "key4": null,
  "key5": ["数组", "元素"],
  "key6": {
    "nested": "嵌套对象"
  }
}

语法规则

  1. 键名:必须用双引号包裹
  2. 字符串值:必须用双引号包裹
  3. 数据类型
    • 字符串:"text"
    • 数字:1233.14
    • 布尔值:truefalse
    • null:null
    • 数组:[值1, 值2]
    • 对象:{"key": value}
  4. 分隔符
    • 键值对用冒号 : 分隔
    • 元素用逗号 , 分隔
  5. 不支持特性
    • 注释
    • 尾随逗号
    • 十六进制数字

4. JSON API 功能(Python)

核心函数

函数 功能 主要参数
json.dump() 序列化到文件 obj, fp, indent, ensure_ascii
json.dumps() 序列化为字符串 obj, indent, separators, default
json.load() 从文件反序列化 fp, object_hook, parse_float
json.loads() 从字符串反序列化 s, object_hook, parse_int

关键参数说明

  1. 序列化参数

    • indent:缩进空格数(美化输出)
    • ensure_ascii=False:允许非ASCII字符(如中文)
    • default:自定义对象序列化函数
    • separators=(',', ':'):紧凑格式
  2. 反序列化参数

    • object_hook:自定义字典转换函数
    • parse_float:自定义浮点数解析
    • parse_int:自定义整数解析

5. JSON 处理流程

json.dumps json.loads json.dump json.load default函数 object_hook Python对象 JSON字符串 Python对象 JSON文件 自定义对象 可序列化字典

6. 应用示例

示例1:基本序列化与反序列化

输入(Python对象)

python 复制代码
data = {
    "server": "web01",
    "status": "online",
    "ports": [80, 443],
    "active": True
}

序列化

python 复制代码
import json

# 转换为JSON字符串
json_str = json.dumps(data, indent=2)
print(json_str)

输出(JSON字符串)

json 复制代码
{
  "server": "web01",
  "status": "online",
  "ports": [
    80,
    443
  ],
  "active": true
}

反序列化

python 复制代码
# 从JSON字符串转换回Python对象
restored_data = json.loads(json_str)
print(restored_data["ports"][0])  # 输出: 80

示例2:文件读写

写入JSON文件

python 复制代码
config = {
    "database": {
        "host": "db.example.com",
        "port": 3306,
        "user": "admin"
    },
    "timeout": 30
}

with open("config.json", "w") as f:
    json.dump(config, f, indent=4)

生成的config.json

json 复制代码
{
    "database": {
        "host": "db.example.com",
        "port": 3306,
        "user": "admin"
    },
    "timeout": 30
}

读取JSON文件

python 复制代码
with open("config.json", "r") as f:
    loaded_config = json.load(f)
    print(loaded_config["database"]["host"])  # 输出: db.example.com

示例3:处理自定义对象

自定义设备类

python 复制代码
class NetworkDevice:
    def __init__(self, name, ip):
        self.name = name
        self.ip = ip

序列化自定义对象

python 复制代码
def device_encoder(obj):
    if isinstance(obj, NetworkDevice):
        return {"device_name": obj.name, "ip_address": obj.ip}
    raise TypeError("不可序列化的对象")

router = NetworkDevice("core-router", "10.0.0.1")
json_str = json.dumps(router, default=device_encoder)
print(json_str)
# 输出: {"device_name": "core-router", "ip_address": "10.0.0.1"}

反序列化自定义对象

python 复制代码
def device_decoder(dct):
    if "device_name" in dct and "ip_address" in dct:
        return NetworkDevice(dct["device_name"], dct["ip_address"])
    return dct

device = json.loads(json_str, object_hook=device_decoder)
print(f"{device.name}: {device.ip}")  # 输出: core-router: 10.0.0.1

示例4:处理特殊数据类型

输入(包含日期)

python 复制代码
from datetime import datetime

log_entry = {
    "event": "login",
    "user": "alice",
    "timestamp": datetime.now()
}

自定义序列化

python 复制代码
def custom_serializer(obj):
    if isinstance(obj, datetime):
        return obj.isoformat()
    return str(obj)  # 其他类型转为字符串

json_str = json.dumps(log_entry, default=custom_serializer)
print(json_str)

输出

json 复制代码
{
  "event": "login",
  "user": "alice",
  "timestamp": "2023-11-15T14:30:45.123456"
}

7. 常见错误处理

python 复制代码
invalid_json = "{'key': 'value'}"  # 错误:JSON要求双引号

try:
    data = json.loads(invalid_json)
except json.JSONDecodeError as e:
    print(f"JSON解析错误: {e.msg}")
    print(f"位置: 行 {e.lineno}, 列 {e.colno}")
    # 实际输出: JSON解析错误: Expecting property name enclosed in double quotes

8. 最佳实践

  1. 美化与压缩

    • 开发环境:使用 indent=2 方便阅读
    • 生产环境:使用 separators=(',', ':') 减少体积
  2. 中文支持

    python 复制代码
    data = {"name": "服务器"}
    json_str = json.dumps(data, ensure_ascii=False)  # 正确显示中文
  3. 数据类型转换

    • JSON数字 → Python int/float
    • JSON数组 → Python list
    • JSON对象 → Python dict
    • JSON null → Python None
  4. 安全注意

    • 不要解析不可信来源的JSON
    • 设置最大解析深度:json.loads(data, max_depth=10)

JSON是现代应用中最常用的数据交换格式,掌握它的基本使用和Python处理技巧,是自动化运维和开发的基础能力。从配置文件到API通信,JSON无处不在!

相关推荐
何双新6 分钟前
Odoo 18进阶开发:打造专业级list,kanban视图Dashboard
python·pycharm
胖哥真不错35 分钟前
基于PyQt5和PaddleSpeech的中文语音识别系统设计与实现(Python)
python·毕业设计·语音识别·课程设计·paddlespeech·pyqt5·中文语音识别系统
码里看花‌36 分钟前
网络编程简介与Netty实战:从入门到高性能Echo服务器
运维·服务器·网络
微信公众号:AI创造财富1 小时前
Pyenv 跟 Conda 还有 Poetry 有什么区别?各有什么不同?
人工智能·python·conda·tensorflow
小毛驴8501 小时前
httpclient实现http连接池
网络·网络协议·http
光电大美美-见合八方中国芯2 小时前
【平面波导外腔激光器专题系列】用于干涉光纤传感的低噪声平面波导外腔激光器
网络·人工智能·科技·平面·性能优化·信息与通信
琢磨先生David2 小时前
常见的 AI 自动编程工具:开启高效编程新时代
java·人工智能·python
萧咕2 小时前
MITM 中间人攻击
网络·web安全·网络安全·安全威胁分析
Narutolxy2 小时前
Spring Boot 应用仅在 IPv6 可达?一次跨越系统、网络与配置的全流程排查实战20250616
网络·spring boot·后端
塑遂2 小时前
LVS+Keepalived高可用群集
网络·智能路由器·lvs