python读取Excel内容并展示成json

shigen坚持更新文章的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长,分享认知,留住感动。
伙伴们,又是许久未曾见面了。最近也是在忙着加班,加上没有新技术的输入和产出,所以推迟了一些。

今天分享的主题是:python读取Excel内容并展示成json

还是先来介绍一下我的背景:昨天突然接到了这样的活,需要用python解析Excel中多个sheet文件的内容,并最终展示成格式化的json。一想,这个我拿手啊,记得shigen之前有一篇这样的文章:如何在终端查看excel内容,岂不是可以直接派上场了。然而事实是我大意了,我没有考虑到excel中存在的部分单元格是函数计算出来的情况。为了更好的说明问题,我先来模拟一个表格看看:

表格中的数据全都是我用程序生成的,可参考文章:一个脚本,实现随机数据生成自由

那我们依旧用之前的程序读取会怎么样子呢?

发现很正常,但昨天就是不行,是我多疑了?我一看,昨天的文件是xlsm格式的,意思也就是现在的文件是带有的。那到时候继续用那个文件试试吧。

现在,我们来实现读取文件并选取指定的范围展示成json的格式。先来看看实现的效果吧:

发现基本是符合预期的,那现在看看代码吧,主要的依赖库可以直接先安装:

复制代码
 pip3 install numpy xlwings

直接执行一下的代码即可,具体的代码、函数调用可参考代码中的注释和文档:

ini 复制代码
 # -*- encoding: utf-8 -*-
 __date__ = '2023/12/23 12:04:32'
 ​
 import json
 import numpy as np
 import xlwings as xw
 ​
 ​
 def get_sheet_matrix(file_path: str, sheet_name: str, start_cell: str, end_cell: str) ->np.ndarray:
     """
     从指定的 Excel 文件中获取指定工作表、区域的数据,并返回一个 NumPy 矩阵。
 ​
     Args:
         file_path (str): Excel 文件的路径。
         sheet_name (str): 要读取数据的工作表名称。
         start_cell (str): 起始单元格的位置,例如 'A1'。
         end_cell (str): 结束单元格的位置,例如 'C3'。
 ​
     Returns:
         numpy.ndarray: 包含指定区域数据的二维数组矩阵。
 ​
     Raises:
         FileNotFoundError: 如果文件路径不存在或无法访问。
         ValueError: 如果起始单元格或结束单元格的位置格式不正确。
 ​
     Example:
         # 示例用法
         file_path = 'path/to/file.xlsx'
         sheet_name = 'Sheet1'
         start_cell = 'A1'
         end_cell = 'C3'
         matrix = get_sheet_matrix(file_path, sheet_name, start_cell, end_cell)
         print(matrix)
     """
     app = xw.App(visible=False)
     workbook = app.books.open(file_path)
     sheet = workbook.sheets[sheet_name]
     # 获取指定区域的值并构建二维列表
     values = sheet.range(start_cell, end_cell).value
     # 将二维列表转换为 NumPy 矩阵
     matrix = np.array(values)
     workbook.close()
     app.quit()
 ​
     return matrix
 ​
 def matrix_to_json(matrix: np.ndarray) -> str:
     """
     将矩阵数据转换为 JSON 格式。
 ​
     Args:
         matrix: 二维 NumPy 数组,包含表头和数据。
 ​
     Returns:
         JSON 格式的字符串。
     """
     headers = matrix[0]
     data = matrix[1:]
 ​
     json_data = []
     for row in data:
         item = {}
         for i in range(len(headers)):
             item[headers[i]] = row[i]
         json_data.append(item)
 ​
     json_str = json.dumps(json_data, indent=2, ensure_ascii=False)
     return json_str
 ​
 if __name__ == '__main__':
     # 此处必须写绝对路径
     file_path = '/Users/zzzz/Downloads/demo.xlsm'
     sheet_name = 'Sheet1'
     start_cell = 'A1'
     end_cell = 'D11'
     matrix = get_sheet_matrix(file_path, sheet_name, start_cell, end_cell)
     print(matrix)
     print(matrix_to_json(matrix))

关于解析xlsm文件中的单元格为函数的问题,后期也会持续的分享,欢迎持续的关注。


以上就是今天分享的全部内容了,觉得不错的话,记得点赞 在看 关注支持一下哈,您的鼓励和支持将是shigen坚持日更的动力。同时,shigen在多个平台都有文章的同步,也可以同步的浏览和订阅:

平台 账号 链接
CSDN shigen01 shigen的CSDN主页
知乎 gen-2019 shigen的知乎主页
掘金 shigen01 shigen的掘金主页
腾讯云开发者社区 shigen shigen的腾讯云开发者社区主页
微信公众平台 shigen 公众号名:shigen

shigen一起,每天不一样!

相关推荐
ITCharge5 分钟前
Docker 万字教程:从入门到掌握
后端·docker·容器
落尘29832 分钟前
Bean 的作用域和生命周期
后端
是店小二呀33 分钟前
处理Linux下磁盘空间不足问题的实用指南
后端
落尘29834 分钟前
如何通过 JWT 来解决登录认证问题
后端
是店小二呀34 分钟前
处理Linux下内存泄漏问题的诊断与解决方法
后端
倚栏听风雨41 分钟前
IDEA 插件开发 对文件夹下的类进行 语法检查
后端
郝同学的测开笔记1 小时前
云原生探索系列(十七):Go 语言sync.Cond
后端·云原生·go
uhakadotcom1 小时前
持续写作的“农耕思维”:如何像农民一样播种,收获稳定成长与收入
后端·面试·github
Java中文社群1 小时前
国内首个「混合推理模型」Qwen3深夜开源,盘点它的N种对接方式!
java·人工智能·后端
JohnYan1 小时前
工作笔记 - ASN.1密钥结构和编码研究
javascript·后端·安全