【脚本系列】如何使用 Python 脚本对同一文件夹中表头相同的 Excel 文件进行合并

目录

  • [🧰 准备工作](#🧰 准备工作)
    • [🐍 安装所需环境](#🐍 安装所需环境)
  • [📁 脚本说明](#📁 脚本说明)
    • [一、核心 Python 脚本:`merge_excel.py`](#一、核心 Python 脚本:merge_excel.py)
      • [✅ 脚本代码:](#✅ 脚本代码:)
  • [⚠️ 使用说明 & 注意事项](#⚠️ 使用说明 & 注意事项)
  • [💡 配套 shell 脚本:`merge_excel.zsh`](#💡 配套 shell 脚本:merge_excel.zsh)
  • [✅ 效果演示](#✅ 效果演示)
  • [📌 小结](#📌 小结)

在日常工作或数据处理场景中,我们经常会遇到这样一种需求:将一个文件夹中多个结构一致(表头相同)的 Excel 文件合并成一个总表,以便于后续的数据分析或汇总处理。

本篇文章将手把手带你使用 Python 实现这一任务。你将学会以下内容:

  • 扫描指定目录下所有合法 Excel 文件
  • 读取多个 Excel 文件为 DataFrame
  • 合并成一个总表并保存
  • 配套 shell 脚本实现一键执行

🧰 准备工作

🐍 安装所需环境

使用 pandasopenpyxl,如果你尚未安装,请先运行以下命令:

bash 复制代码
pip install pandas openpyxl xlrd

📁 脚本说明

一、核心 Python 脚本:merge_excel.py

这是我们本次任务的核心脚本,功能是:

从指定文件夹中读取所有 .xlsx.xls 文件(排除临时文件),合并后保存为 merged_result.xlsx

✅ 脚本代码:

python 复制代码
import pandas as pd
import os
import warnings

# 忽略一些可能出现但不影响程序运行的警告
warnings.simplefilter("ignore", UserWarning)

# 设置需要合并的 Excel 文件所在的文件夹路径
folder_path = '/你的文件夹路径/'

# 筛选 Excel 文件,排除以 ~ 或 .~ 开头的临时文件
excel_files = [f for f in os.listdir(folder_path)
               if f.endswith(('.xlsx', '.xls')) and not f.startswith('~') and not f.startswith('.~')]

if not excel_files:
    print("❌ 没有找到有效的 Excel 文件")
    input("按回车键退出...")
    exit()

data_frames = []

for file in excel_files:
    file_path = os.path.join(folder_path, file)
    try:
        if file.endswith('.xlsx'):
            df = pd.read_excel(file_path, engine='openpyxl')
        elif file.endswith('.xls'):
            df = pd.read_excel(file_path, engine='xlrd')
        else:
            print(f"⚠️ 跳过不支持的文件:{file}")
            continue
        data_frames.append(df)
        print(f"✅ 读取成功:{file}")
    except Exception as e:
        print(f"❌ 读取失败:{file},错误:{e}")

# 合并所有 DataFrame 并输出
if data_frames:
    combined_df = pd.concat(data_frames, ignore_index=True)
    output_path = os.path.join(folder_path, 'merged_result.xlsx')
    combined_df.to_excel(output_path, index=False)
    print("\n✅ 合并完成,文件保存在:", output_path)
else:
    print("\n❗未成功读取任何表格")

input("\n按回车键退出...")

⚠️ 使用说明 & 注意事项

  • 所有文件 必须有相同的表头结构(字段顺序和名称)。
  • 支持 .xlsx.xls 两种常见 Excel 格式。
  • 会自动忽略临时文件(如以 ~.~ 开头的缓存文件)。
  • 合并后结果保存在当前目录下的 merged_result.xlsx 文件中。

💡 配套 shell 脚本:merge_excel.zsh

为了简化执行过程,我们可以添加一个 shell 脚本,做到 双击或一键执行合并任务

zsh 复制代码
#!/bin/zsh

# 自动跳转到当前脚本所在目录
cd "$(dirname "$0")"

# 执行 Python 脚本
python3 merge_excel.py

步骤:

  1. merge_excel.pymerge_excel.zsh 放在同一目录下。

  2. 终端执行一次:

    bash 复制代码
    chmod +x merge_excel.zsh
  3. 之后双击或运行:

    bash 复制代码
    ./merge_excel.zsh

✅ 效果演示

在你运行脚本后,控制台会逐个显示哪些文件读取成功,哪些文件出现问题,并最终提示:

复制代码
✅ 合并完成,文件保存在:/xxx/merged_result.xlsx

按回车键退出...

你可以直接打开该文件进行数据核查或分析。


📌 小结

通过这篇教程,我们实现了一个 可复用、可扩展 的 Excel 合并脚本,并学会了:

  • 如何读取多个 Excel 文件
  • 如何处理不同扩展名和引擎
  • 如何过滤临时文件
  • 如何生成合并结果文件
  • 如何用 shell 脚本简化执行
相关推荐
晨非辰23 分钟前
#C语言——刷题攻略:牛客编程入门训练(四):运算(二)
c语言·开发语言·经验分享·学习·visual studio
爱喝水的鱼丶27 分钟前
SAP-ABAP:ABAP Open SQL 深度解析:核心特性、性能优化与实践指南
运维·开发语言·数据库·sql·性能优化·sap·abap
魔都吴所谓1 小时前
【go】map基础操作
开发语言·后端·golang
程序员编程指南2 小时前
Qt 嵌入式 Linux 系统定制全指南
linux·c语言·开发语言·c++·qt
橙 子_5 小时前
基于 Amazon Nova Sonic 和 MCP 构建语音交互 Agent
python
宇寒风暖7 小时前
Flask 框架全面详解
笔记·后端·python·学习·flask·知识
seabirdssss7 小时前
错误: 找不到或无法加载主类 原因: java.lang.ClassNotFoundException
java·开发语言
哪 吒7 小时前
【2025C卷】华为OD机试九日集训第3期 - 按算法分类,由易到难,提升编程能力和解题技巧
python·算法·华为od·华为od机试·2025c卷
gnawkhhkwang7 小时前
io_getevents 和 io_pgetevents 系统调用及示例
linux·c语言·开发语言
喵手7 小时前
使用ASIWebPageRequest库编写Objective-C下载器程序
开发语言·macos·objective-c