Python提取JSON数据中的键值对并保存为.csv文件

本文介绍基于Python ,读取JSON 文件数据,并将JSON 文件中指定的键值对数据 转换为.csv格式文件的方法。

在之前的文章Python提取JSON文件中的指定数据并保存在CSV或Excel表格文件内https://blog.csdn.net/zhebushibiaoshifu/article/details/132572161)中,我们就介绍过将**JSON** 文件数据保存到.csv格式或.xlsx格式的表格文件中的方法;而本文我们将针对不同的待提取数据特征,给出另一种方法。

首先,我们来明确一下具体的需求。我们现有一个JSON 文件数据,是一个包含多个JSON 对象的列表,如下图所示;其中,我们希望将text中的内容提取出来------text中的数据都是以键值对 的形式存储的,我们希望的是,将键值对 作为.csv格式文件的列名 ,而 则是这一列对应的值 ;因为这个JSON 数据中包含很多个text(每一个text中的所有 都是一样的,但是 不完全一致),所以我们最后就会得到一个具有很多行的.csv格式文件。

明确了需求,我们就可以开始代码的撰写。本文所用代码如下。

python 复制代码
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Fri Sep 15 11:12:01 2023

@author: fkxxgis
"""

import json
import csv

json_file = "/Users/ddd/Downloads/single.json"

with open(json_file, 'r') as file:
    data = json.load(file)

fieldnames = set()
for item in data:
    fieldnames.update(json.loads(item['text']).keys())

csv_filename = "/Users/didi/Downloads/output.csv"

with open(csv_filename, 'w', newline='') as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    for item in data:
        json_string = item['text']
        row_data = json.loads(json_string)
        writer.writerow(row_data)

其中,我们首先通过import语句导入必要的Python 模块,包括用于处理JSON 数据的json和用于处理CSV 文件的csv

接下来,我们打开名为single.jsonJSON 文件并读取其内容,将其存储在data变量中。json.load(file)用于将JSON 文件内容加载到Python 数据结构中。随后,创建一个空集合fieldnames,用于存储将在CSV文件的头部写入的列名。

紧接着,我们遍历data列表中的每个元素,其中每个元素是一个包含JSON 格式的字符串的字典。对于每个元素,将JSON 文本------也就是item['text']解析为字典,并获取该字典中的所有键。这些键将被添加到fieldnames集合中,以便稍后在CSV文件的头部(列名称)使用。

其次,创建一个CSV 文件output.csv以进行写入,使用csv.DictWriter对象初始化,其中指定了要写入的列名(通过fieldnames变量)。使用writer.writeheader()写入CSV 文件的头部,这将包含字段名称。最后,遍历data列表中的每个元素,对于每个元素,将JSON 文本解析为字典,并将该字典的数据写入CSV 文件中,每行对应一个JSON对象。

执行上述代码,我们即可在指定的结果.csv格式文件中看到我们转换之后的数据结果;如下图所示。其中,紫色框内部分就是列名,也就是我们提取出来的 ,而则是每一行的数据。

至此,大功告成。

欢迎关注:疯狂学习GIS

相关推荐
这儿有一堆花6 分钟前
从图像到精准文字:基于PyTorch与CTC的端到端手写文本识别实战
人工智能·pytorch·python
SunnyDays101126 分钟前
Python 高效实现 PDF 转 Word:告别手动复制粘贴
python·pdf转word·pdf转docx·pdf转doc·pdf到word转换
hhzz1 小时前
Pythoner 的Flask项目实践-绘制点/线/面并分类型保存为shpfile功能(Mapboxgl底图)
python·flask·gis·mapboxgl
Lxinccode1 小时前
python(42) : 监听本地文件夹上传到服务器指定目录
服务器·开发语言·python·文件上传服务器·监听文件上传服务器
葡萄城技术团队2 小时前
Excel 转在线协作难题破解:SpreadJS 纯前端表格控件的技术方案与实践
前端·excel
我是华为OD~HR~栗栗呀2 小时前
前端面经-高级开发(华为od)
java·前端·后端·python·华为od·华为·面试
木头左2 小时前
跨周期共振效应在ETF网格参数适配中的应用技巧
开发语言·python·算法
爱蹦跶的精灵2 小时前
降级版本Pillow解决freetypefont has no attribute getsize问题
python·pillow
一人の梅雨3 小时前
亚马逊 MWS 关键字 API 实战:关键字搜索商品列表接口深度解析与优化方案
python·spring
唐叔在学习5 小时前
pip安装太慢?一键切换国内镜像源,速度飞起!
后端·python