自动化办公|xlwings与pandas交互

1. 介绍

在数据分析和 Excel 自动化中,pandas 作为 Python 处理数据的强大库,而 xlwings 则可以高效操作 Excel。将 pandasxlwings 结合使用,可以实现从 Excel 读取数据到 DataFrame、将 DataFrame 写入 Excel 以及 Excel 的自动化处理。


2. 从 Excel 读取数据到 Pandas DataFrame

2.1 读取整个表格

复制代码
import xlwings as xw
import pandas as pd

wb = xw.Book("example.xlsx")  # 打开 Excel 文件
sheet = wb.sheets["Sheet1"]   # 选择工作表

# 读取 Excel 数据到 Pandas DataFrame
data = sheet.range("A1").expand().options(pd.DataFrame, index=False).value
print(data)

2.2 读取指定范围的数据

复制代码
subset = sheet.range("A1:C10").options(pd.DataFrame, index=False).value
print(subset)

3. 将 Pandas DataFrame 写入 Excel

3.1 将 DataFrame 写入 Excel 指定位置

复制代码
data = pd.DataFrame({
    "姓名": ["张三", "李四", "王五"],
    "年龄": [25, 30, 28],
    "城市": ["北京", "上海", "广州"]
})

# 写入 Excel
sheet.range("A1").value = data

3.2 追加数据到 Excel

复制代码
last_row = sheet.range("A" + str(sheet.cells.last_cell.row)).end("up").row
sheet.range(f"A{last_row+1}").value = data

4. 使用 Pandas 与 xlwings 自动化 Excel 处理

4.1 调整列宽

复制代码
sheet.autofit("columns")  # 自动调整列宽

4.2 应用 Excel 公式

复制代码
sheet.range("D2").formula = "=SUM(B2:B10)"  # 在 D2 单元格插入求和公式

4.3 设置 Excel 格式

复制代码
sheet.range("A1:C1").font.bold = True  # 设置标题加粗
sheet.range("B:B").number_format = "0"  # 设置数值格式

5. 读取带有公式的 Excel 数据

5.1 获取公式内容

复制代码
formulas = sheet.range("D2:D10").formula  # 获取公式而不是计算后的值
print(formulas)

5.2 获取公式计算后的值

复制代码
values = sheet.range("D2:D10").value  # 获取计算后的值
print(values)

6. 结合 Pandas 与 xlwings 处理大数据

6.1 读取大数据集并转换

复制代码
data = sheet.range("A1").expand().options(pd.DataFrame, index=False, chunksize=1000).value

6.2 分批写入 Excel

复制代码
for i, chunk in enumerate(data):
    sheet.range(f"A{i*1000+1}").value = chunk

7. 结论

结合 pandasxlwings,我们可以高效地读取、写入和操作 Excel 数据,并利用 Excel 的自动化功能提升生产力。这种方法适用于数据分析、报表生成和企业自动化任务。

相关推荐
烛阴3 小时前
简单入门Python装饰器
前端·python
好开心啊没烦恼3 小时前
Python 数据分析:numpy,说人话,说说数组维度。听故事学知识点怎么这么容易?
开发语言·人工智能·python·数据挖掘·数据分析·numpy
面朝大海,春不暖,花不开3 小时前
使用 Python 实现 ETL 流程:从文本文件提取到数据处理的全面指南
python·etl·原型模式
2301_805054564 小时前
Python训练营打卡Day59(2025.7.3)
开发语言·python
万千思绪5 小时前
【PyCharm 2025.1.2配置debug】
ide·python·pycharm
微风粼粼6 小时前
程序员在线接单
java·jvm·后端·python·eclipse·tomcat·dubbo
云天徽上7 小时前
【PaddleOCR】OCR表格识别数据集介绍,包含PubTabNet、好未来表格识别、WTW中文场景表格等数据,持续更新中......
python·ocr·文字识别·表格识别·paddleocr·pp-ocrv5
你怎么知道我是队长7 小时前
python-input内置函数
开发语言·python
XMAIPC_Robot7 小时前
基于ARM+FPGA的光栅尺精密位移加速度测试解决方案
arm开发·人工智能·fpga开发·自动化·边缘计算
叹一曲当时只道是寻常7 小时前
Python实现优雅的目录结构打印工具
python