Python之Excel合并

大家好!今天我们要一起探索如何使用Python这个神奇的工具,将一堆Excel文件轻松合并成一个大文件。想象一下,就像是一台高效的Excel数据收割机,让你的工作效率飙升!准备好你的笔记本,跟着我一步步操作吧。

1. 导入所需库

首先,我们需要导入两个Python库:pandasospandas 是数据分析的大杀器,而 os 则帮我们处理文件和目录操作。

python 复制代码
import pandas as pd
import os

2. 定义函数:读取Excel文件

接下来,我们要创建一个函数 read_excel_files(),它会遍历指定目录下的所有Excel文件,并读取内容。

python 复制代码
def read_excel_files(directory):
    excel_files = [f for f in os.listdir(directory) if f.endswith('.xlsx') or f.endswith('.xls')]
    data_frames = []
    for file in excel_files:
        df = pd.read_excel(os.path.join(directory, file))
        data_frames.append(df)
    return data_frames

3. 合并数据

现在有了读取文件的函数,我们可以用另一个函数 merge_dataframes() 来合并所有数据帧。

python 复制代码
def merge_dataframes(data_frames):
    merged_df = pd.concat(data_frames, ignore_index=True)
    return merged_df

ignore_index=True 是为了确保合并后的行索引从0开始,这样看起来更清爽。

4. 写入新Excel文件

最后,我们来一个"一键合并"操作,把所有数据写入新的Excel文件。

python 复制代码
def write_to_excel(merged_df, output_file):
    merged_df.to_excel(output_file, index=False)

5. 实战演练

现在,把这些函数串起来用一个简单的例子展示:

python 复制代码
# 指定要读取的文件夹路径
input_dir = 'your_directory_with_excel_files'

# 创建一个新的Excel文件保存结果
output_file = 'merged_data.xlsx'

# 读取文件、合并数据并写入新文件
all_data = read_excel_files(input_dir)
merged_data = merge_dataframes(all_data)
write_to_excel(merged_data, output_file)

print(f"恭喜你,所有数据已合并到'{output_file}'!")

记得将 your_directory_with_excel_files 替换为你实际存放Excel文件的文件夹路径。

就这样,通过Python,你不再需要手动一个接一个地打开和粘贴数据了。这不仅提高了效率,还能避免因为手动操作可能出现的错误。快去试试看吧,让你的Excel数据管理变得更简单、更有趣!

相关推荐
牛油果子哥q9 分钟前
【C++ const 】全场景深度精讲:修饰规则、底层常量折叠、指针 / 引用 / 成员函数实战、易错坑点与工程代码实现
开发语言·c++
天天进步201523 分钟前
Python全栈项目--社区问答平台
开发语言·python·django
skywalk816329 分钟前
Tree-sitter是一个解析器生成器工具和一个增量解析库。它可以为源文件构建具体的语法树,并在编辑源文件时有效地更新语法树
开发语言·编程
噜噜噜阿鲁~38 分钟前
python学习笔记 | 12.0、错误、调试和测试
笔记·python·学习
AI视觉网奇41 分钟前
Bambu Studio 发现 xx个开放边
开发语言·人工智能·python
qq_458148201 小时前
科大讯飞实时语音识别(rtasr)真实项目踩坑经验总结与手把手教学真实可运行Demo
java·开发语言·websocket·语音识别
三品吉他手会点灯1 小时前
C语言学习笔记 - 46.运算符和表达式 - 运算符4 - 对初学运算符的一些建议
c语言·开发语言·笔记·学习
创业之路&下一个五年1 小时前
mvvm中v和vm关系,vm中v和m的关系?
java·开发语言·javascript
SilentSamsara1 小时前
缓存策略实战:Redis + Python 多级缓存设计与失效策略
开发语言·redis·python·缓存·性能优化
zlinear数据采集卡1 小时前
输出短路保护电路深度解析:从电源的“最后一道防线”到ZLinear采集卡的硬核守护实战
开发语言·嵌入式硬件·持续集成