17.使用读写包操作Excel文件:pyxlsb 包

一 pyxlsb 的介绍

如果你要读取二进制的 xlsb 格式的 Excel 文件,那么 pyxlsb 就成了唯一选择。
.xlsb 是 Excel 的二进制文件格式,专为高效存储和快速读取设计。

pyxlsb 是一个专门用于读取 .xlsb 文件的 Python 库,但不支持写入。


二 如何使用

1.遍历 .xlsb 文件中的所有工作表,并打印每个工作表的行数和列数

python 复制代码
import pyxlsb
import excel

with pyxlsb.open_workbook("xl/stores.xlsb") as book:
 for sheet_name in book.sheets:
  with book.get_sheet(sheet_name) as sheet:
   dim = sheet.dimension
   print(f"Sheet '{sheet_name}' has "f"{dim.h} rows and {dim.w} cols")

**book.sheets:**返回一个工作簿中所有工作表的名称列表。

for sheet_name in book.sheets:遍历工作簿中的所有工作表名称。

**book.get_sheet(sheet_name):**获取某个具体的工作表对象(通过名称)。

sheet.dimension: 获取工作表的维度,包括:dim.h: 工作表的总行数。dim.w: 工作表的总列数。

**print():**打印每个工作表的名称以及其行数和列数。

2.读取特定工作表(如 "2019")中从 "B2" 开始的某些数据,并打印前两行

python 复制代码
with pyxlsb.open_workbook("xl/stores.xlsb") as book:
 with book.get_sheet("2019") as sheet:
  data = excel.read(sheet, "B2")
print(data[:2])  # 打印前两行

with book.get_sheet("2019"): 通过工作表名称索引打开名为 "2019" 的工作表。

excel.read(sheet, "B2") :使用 excel 模块(自定义模块)从指定单元格("B2")开始读取数据。返回一个列表的结构,保存读取到的值。

3.将以日期为格式的单元格中的值转换为 datetime 对象

pyxlsb 库在读取 .xlsb 文件时,无法直接识别和解析包含日期的单元格。它会将这些日期值作为原始的数值数据(例如浮点时间戳)返回。因此,用户需要手动将这些数值转换为 Python 的 datetime 对象。

python 复制代码
from pyxlsb import convert_date

# 假设 data[1][3] 是从某个单元格读取到的日期值(数值格式)
converted_date = convert_date(data[1][3])

# 转换后得到的是一个 datetime 对象,例如:
# datetime.datetime(2018, 7, 20, 0, 0)

convert_datepyxlsb 提供的一个实用函数,用于将以数字形式存储的日期值转换为 Python 的 datetime.datetime 对象。

data[1][3] 表示第二行第四列的值。如果这个单元格包含日期,那么它的值可能是一个浮点数,表示 Excel 内部的时间戳。

调用 convert_date(data[1][3]) 会将这个浮点数转换为一个 datetime.datetime 对象。转换后可能得到 datetime.datetime(2018, 7, 20, 0, 0),这表示日期为 2018 年 7 月 20 日,时间为午夜(00:00)。

4.在使用版本低于 1.3 的 pandas 读取 xlsb 格式的文件时,需要显式地指定引擎

python 复制代码
 df = pd.read_excel("xl/stores.xlsb", engine="pyxlsb")
相关推荐
☼←安于亥时→❦4 小时前
PyTorch 梯度与微积分
人工智能·pytorch·python
程序员三藏4 小时前
2025最新的软件测试面试八股文(800+道题)
自动化测试·软件测试·python·功能测试·测试工具·面试·职场和发展
Pocker_Spades_A4 小时前
Python快速入门专业版(二十三):for循环基础:遍历字符串、列表与range()函数(计数案例)
python
闲人编程5 小时前
图像去雾算法:从物理模型到深度学习实现
图像处理·人工智能·python·深度学习·算法·计算机视觉·去雾
上官浩仁5 小时前
springboot excel 表格入门与实战
java·spring boot·excel
Kyln.Wu6 小时前
【python实用小脚本-211】[硬件互联] 桌面壁纸×Python梦幻联动|用10行代码实现“开机盲盒”自动化改造实录(建议收藏)
开发语言·python·自动化
Ms_Big7 小时前
ppliteseg改rknn,部署在嵌入式板,加速模型
人工智能·python·深度学习
CC数分7 小时前
零基础3个月上岸[特殊字符]自学数据分析路线
学习·数据挖掘·数据分析·大学生·考证
折翼的恶魔7 小时前
数据分析:合并
python·数据分析·pandas
百锦再7 小时前
在 CentOS 系统上实现定时执行 Python 邮件发送任务
java·linux·开发语言·人工智能·python·centos·pygame