python读取Excel内容并展示成json

shigen坚持更新文章的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长,分享认知,留住感动。
伙伴们,又是许久未曾见面了。最近也是在忙着加班,加上没有新技术的输入和产出,所以推迟了一些。

今天分享的主题是:python读取Excel内容并展示成json

还是先来介绍一下我的背景:昨天突然接到了这样的活,需要用python解析Excel中多个sheet文件的内容,并最终展示成格式化的json。一想,这个我拿手啊,记得shigen之前有一篇这样的文章:如何在终端查看excel内容,岂不是可以直接派上场了。然而事实是我大意了,我没有考虑到excel中存在的部分单元格是函数计算出来的情况。为了更好的说明问题,我先来模拟一个表格看看:

表格中的数据全都是我用程序生成的,可参考文章:一个脚本,实现随机数据生成自由

那我们依旧用之前的程序读取会怎么样子呢?

发现很正常,但昨天就是不行,是我多疑了?我一看,昨天的文件是xlsm格式的,意思也就是现在的文件是带有的。那到时候继续用那个文件试试吧。

现在,我们来实现读取文件并选取指定的范围展示成json的格式。先来看看实现的效果吧:

发现基本是符合预期的,那现在看看代码吧,主要的依赖库可以直接先安装:

 pip3 install numpy xlwings

直接执行一下的代码即可,具体的代码、函数调用可参考代码中的注释和文档:

ini 复制代码
 # -*- encoding: utf-8 -*-
 __date__ = '2023/12/23 12:04:32'
 ​
 import json
 import numpy as np
 import xlwings as xw
 ​
 ​
 def get_sheet_matrix(file_path: str, sheet_name: str, start_cell: str, end_cell: str) ->np.ndarray:
     """
     从指定的 Excel 文件中获取指定工作表、区域的数据,并返回一个 NumPy 矩阵。
 ​
     Args:
         file_path (str): Excel 文件的路径。
         sheet_name (str): 要读取数据的工作表名称。
         start_cell (str): 起始单元格的位置,例如 'A1'。
         end_cell (str): 结束单元格的位置,例如 'C3'。
 ​
     Returns:
         numpy.ndarray: 包含指定区域数据的二维数组矩阵。
 ​
     Raises:
         FileNotFoundError: 如果文件路径不存在或无法访问。
         ValueError: 如果起始单元格或结束单元格的位置格式不正确。
 ​
     Example:
         # 示例用法
         file_path = 'path/to/file.xlsx'
         sheet_name = 'Sheet1'
         start_cell = 'A1'
         end_cell = 'C3'
         matrix = get_sheet_matrix(file_path, sheet_name, start_cell, end_cell)
         print(matrix)
     """
     app = xw.App(visible=False)
     workbook = app.books.open(file_path)
     sheet = workbook.sheets[sheet_name]
     # 获取指定区域的值并构建二维列表
     values = sheet.range(start_cell, end_cell).value
     # 将二维列表转换为 NumPy 矩阵
     matrix = np.array(values)
     workbook.close()
     app.quit()
 ​
     return matrix
 ​
 def matrix_to_json(matrix: np.ndarray) -> str:
     """
     将矩阵数据转换为 JSON 格式。
 ​
     Args:
         matrix: 二维 NumPy 数组,包含表头和数据。
 ​
     Returns:
         JSON 格式的字符串。
     """
     headers = matrix[0]
     data = matrix[1:]
 ​
     json_data = []
     for row in data:
         item = {}
         for i in range(len(headers)):
             item[headers[i]] = row[i]
         json_data.append(item)
 ​
     json_str = json.dumps(json_data, indent=2, ensure_ascii=False)
     return json_str
 ​
 if __name__ == '__main__':
     # 此处必须写绝对路径
     file_path = '/Users/zzzz/Downloads/demo.xlsm'
     sheet_name = 'Sheet1'
     start_cell = 'A1'
     end_cell = 'D11'
     matrix = get_sheet_matrix(file_path, sheet_name, start_cell, end_cell)
     print(matrix)
     print(matrix_to_json(matrix))

关于解析xlsm文件中的单元格为函数的问题,后期也会持续的分享,欢迎持续的关注。


以上就是今天分享的全部内容了,觉得不错的话,记得点赞 在看 关注支持一下哈,您的鼓励和支持将是shigen坚持日更的动力。同时,shigen在多个平台都有文章的同步,也可以同步的浏览和订阅:

平台 账号 链接
CSDN shigen01 shigen的CSDN主页
知乎 gen-2019 shigen的知乎主页
掘金 shigen01 shigen的掘金主页
腾讯云开发者社区 shigen shigen的腾讯云开发者社区主页
微信公众平台 shigen 公众号名:shigen

shigen一起,每天不一样!

相关推荐
uhakadotcom28 分钟前
AI搜索引擎的尽头是电商?从perplexity开始卖货说起...
前端·人工智能·后端
uhakadotcom31 分钟前
Java中的代码简化技巧:让开发更轻松
后端
张声录11 小时前
使用client-go在命令空间test里面对pod进行操作
开发语言·后端·golang
新智元2 小时前
AI卷翻科研!DeepMind 36页报告:全球实验室被「AI科学家」指数级接管
人工智能·后端
Adolf_19932 小时前
Django 自定义路由转换器
后端·python·django
ᝰꫝꪉꪯꫀ3613 小时前
JavaWeb——Mybatis
java·开发语言·后端·mybatis
机器之心3 小时前
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
人工智能·后端
爱上语文3 小时前
Http 响应协议
网络·后端·网络协议·http
Smilejudy4 小时前
三行五行的 SQL 只存在于教科书和培训班
后端·github
爱上语文4 小时前
Http 请求协议
网络·后端·网络协议·http