关键技术
-
pandas数据处理
-
os模块文件遍历
-
openpyxl/xlsxwriter引擎
代码实现
python
import pandas as pd
import os
def batch_process_excel(folder_path):
"""
批量处理文件夹中的所有Excel文件
"""
processed_data = []
for file in os.listdir(folder_path):
if file.endswith(('.xlsx', '.xls')):
# 读取Excel文件
df = pd.read_excel(os.path.join(folder_path, file))
# 数据处理示例:计算每个文件的销售总额
total_sales = df['销售额'].sum()
processed_data.append({
'文件名': file,
'总销售额': total_sales,
'数据行数': len(df)
})
# 生成汇总报告
result_df = pd.DataFrame(processed_data)
result_df.to_excel('处理结果汇总.xlsx', index=False)
return result_df
# 使用示例
if __name__ == '__main__':
summary = batch_process_excel('./excel_files')
print("处理完成!")
效果对比
| 处理方式 | 10个文件耗时 | 代码量 |
|---|---|---|
| 手动操作 | ~30分钟 | - |
| Python自动化 | ~1分钟 | 20行 |
注意事项
-
确保已安装依赖:
pip install pandas openpyxl -
文件路径使用原始字符串或双反斜杠
-
处理前建议备份原始数据
总结
通过Python实现Excel自动化处理,可以节省大量重复性工作时间。本文介绍的方法可以进一步扩展,如添加数据清洗、格式转换等功能。