Python之Excel合并

大家好!今天我们要一起探索如何使用Python这个神奇的工具,将一堆Excel文件轻松合并成一个大文件。想象一下,就像是一台高效的Excel数据收割机,让你的工作效率飙升!准备好你的笔记本,跟着我一步步操作吧。

1. 导入所需库

首先,我们需要导入两个Python库:pandasospandas 是数据分析的大杀器,而 os 则帮我们处理文件和目录操作。

python 复制代码
import pandas as pd
import os

2. 定义函数:读取Excel文件

接下来,我们要创建一个函数 read_excel_files(),它会遍历指定目录下的所有Excel文件,并读取内容。

python 复制代码
def read_excel_files(directory):
    excel_files = [f for f in os.listdir(directory) if f.endswith('.xlsx') or f.endswith('.xls')]
    data_frames = []
    for file in excel_files:
        df = pd.read_excel(os.path.join(directory, file))
        data_frames.append(df)
    return data_frames

3. 合并数据

现在有了读取文件的函数,我们可以用另一个函数 merge_dataframes() 来合并所有数据帧。

python 复制代码
def merge_dataframes(data_frames):
    merged_df = pd.concat(data_frames, ignore_index=True)
    return merged_df

ignore_index=True 是为了确保合并后的行索引从0开始,这样看起来更清爽。

4. 写入新Excel文件

最后,我们来一个"一键合并"操作,把所有数据写入新的Excel文件。

python 复制代码
def write_to_excel(merged_df, output_file):
    merged_df.to_excel(output_file, index=False)

5. 实战演练

现在,把这些函数串起来用一个简单的例子展示:

python 复制代码
# 指定要读取的文件夹路径
input_dir = 'your_directory_with_excel_files'

# 创建一个新的Excel文件保存结果
output_file = 'merged_data.xlsx'

# 读取文件、合并数据并写入新文件
all_data = read_excel_files(input_dir)
merged_data = merge_dataframes(all_data)
write_to_excel(merged_data, output_file)

print(f"恭喜你,所有数据已合并到'{output_file}'!")

记得将 your_directory_with_excel_files 替换为你实际存放Excel文件的文件夹路径。

就这样,通过Python,你不再需要手动一个接一个地打开和粘贴数据了。这不仅提高了效率,还能避免因为手动操作可能出现的错误。快去试试看吧,让你的Excel数据管理变得更简单、更有趣!

相关推荐
skywalk81639 分钟前
发现Kotti项目的python包Beaker 存在安全漏洞
开发语言·网络·python·安全
天天进步201540 分钟前
Python全栈项目:从零构建基于 Django 的知识管理系统(KMS)
开发语言·python·django
珎珎啊1 小时前
Python3 迭代器与生成器
开发语言·python
凯瑟琳.奥古斯特1 小时前
C++变量与基本类型精解
开发语言·c++
思绪无限1 小时前
YOLOv5至YOLOv12升级:金属锈蚀检测系统的设计与实现(完整代码+界面+数据集项目)
人工智能·python·深度学习·目标检测·计算机视觉·yolov12
yejqvow121 小时前
Pandas 高效实现组内跨行时间戳匹配与布尔标记
jvm·数据库·python
喜欢吃鱿鱼1 小时前
DES加解密(附带解决转义问题)-VUE
开发语言·前端·javascript
愚者游世1 小时前
variadic templates(可变参数模板)各版本异同
开发语言·c++·程序人生·面试
2501_921960852 小时前
协同本体论:元公理体系、普适演化律则与工程范式统一构建
python·重构·numpy·pandas·scipy
小锋java12342 小时前
【技术专题】Matplotlib3 Python 数据可视化 - Matplotlib3 绘制热力图(Heatmap)
python