自动化办公|xlwings与pandas交互

1. 介绍

在数据分析和 Excel 自动化中,pandas 作为 Python 处理数据的强大库,而 xlwings 则可以高效操作 Excel。将 pandasxlwings 结合使用,可以实现从 Excel 读取数据到 DataFrame、将 DataFrame 写入 Excel 以及 Excel 的自动化处理。


2. 从 Excel 读取数据到 Pandas DataFrame

2.1 读取整个表格

复制代码
import xlwings as xw
import pandas as pd

wb = xw.Book("example.xlsx")  # 打开 Excel 文件
sheet = wb.sheets["Sheet1"]   # 选择工作表

# 读取 Excel 数据到 Pandas DataFrame
data = sheet.range("A1").expand().options(pd.DataFrame, index=False).value
print(data)

2.2 读取指定范围的数据

复制代码
subset = sheet.range("A1:C10").options(pd.DataFrame, index=False).value
print(subset)

3. 将 Pandas DataFrame 写入 Excel

3.1 将 DataFrame 写入 Excel 指定位置

复制代码
data = pd.DataFrame({
    "姓名": ["张三", "李四", "王五"],
    "年龄": [25, 30, 28],
    "城市": ["北京", "上海", "广州"]
})

# 写入 Excel
sheet.range("A1").value = data

3.2 追加数据到 Excel

复制代码
last_row = sheet.range("A" + str(sheet.cells.last_cell.row)).end("up").row
sheet.range(f"A{last_row+1}").value = data

4. 使用 Pandas 与 xlwings 自动化 Excel 处理

4.1 调整列宽

复制代码
sheet.autofit("columns")  # 自动调整列宽

4.2 应用 Excel 公式

复制代码
sheet.range("D2").formula = "=SUM(B2:B10)"  # 在 D2 单元格插入求和公式

4.3 设置 Excel 格式

复制代码
sheet.range("A1:C1").font.bold = True  # 设置标题加粗
sheet.range("B:B").number_format = "0"  # 设置数值格式

5. 读取带有公式的 Excel 数据

5.1 获取公式内容

复制代码
formulas = sheet.range("D2:D10").formula  # 获取公式而不是计算后的值
print(formulas)

5.2 获取公式计算后的值

复制代码
values = sheet.range("D2:D10").value  # 获取计算后的值
print(values)

6. 结合 Pandas 与 xlwings 处理大数据

6.1 读取大数据集并转换

复制代码
data = sheet.range("A1").expand().options(pd.DataFrame, index=False, chunksize=1000).value

6.2 分批写入 Excel

复制代码
for i, chunk in enumerate(data):
    sheet.range(f"A{i*1000+1}").value = chunk

7. 结论

结合 pandasxlwings,我们可以高效地读取、写入和操作 Excel 数据,并利用 Excel 的自动化功能提升生产力。这种方法适用于数据分析、报表生成和企业自动化任务。

相关推荐
用户277844910499313 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
JavaEdge在掘金15 小时前
ssl.SSLCertVerificationError报错解决方案
python
我不会编程55515 小时前
Python Cookbook-5.1 对字典排序
开发语言·数据结构·python
工业通讯探索者16 小时前
ProfiNet转CANopen协议转换网关驱动新能源汽车生产线多轴同步控制
自动化·工业物联网·协议转换网关·网关模块·总线协议
老歌老听老掉牙16 小时前
平面旋转与交线投影夹角计算
python·线性代数·平面·sympy
满怀101516 小时前
Python入门(7):模块
python
无名之逆16 小时前
Rust 开发提效神器:lombok-macros 宏库
服务器·开发语言·前端·数据库·后端·python·rust
你觉得20516 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
啊喜拔牙16 小时前
1. hadoop 集群的常用命令
java·大数据·开发语言·python·scala
__lost17 小时前
Pysides6 Python3.10 Qt 画一个时钟
python·qt