Python之Excel合并

大家好!今天我们要一起探索如何使用Python这个神奇的工具,将一堆Excel文件轻松合并成一个大文件。想象一下,就像是一台高效的Excel数据收割机,让你的工作效率飙升!准备好你的笔记本,跟着我一步步操作吧。

1. 导入所需库

首先,我们需要导入两个Python库:pandasospandas 是数据分析的大杀器,而 os 则帮我们处理文件和目录操作。

python 复制代码
import pandas as pd
import os

2. 定义函数:读取Excel文件

接下来,我们要创建一个函数 read_excel_files(),它会遍历指定目录下的所有Excel文件,并读取内容。

python 复制代码
def read_excel_files(directory):
    excel_files = [f for f in os.listdir(directory) if f.endswith('.xlsx') or f.endswith('.xls')]
    data_frames = []
    for file in excel_files:
        df = pd.read_excel(os.path.join(directory, file))
        data_frames.append(df)
    return data_frames

3. 合并数据

现在有了读取文件的函数,我们可以用另一个函数 merge_dataframes() 来合并所有数据帧。

python 复制代码
def merge_dataframes(data_frames):
    merged_df = pd.concat(data_frames, ignore_index=True)
    return merged_df

ignore_index=True 是为了确保合并后的行索引从0开始,这样看起来更清爽。

4. 写入新Excel文件

最后,我们来一个"一键合并"操作,把所有数据写入新的Excel文件。

python 复制代码
def write_to_excel(merged_df, output_file):
    merged_df.to_excel(output_file, index=False)

5. 实战演练

现在,把这些函数串起来用一个简单的例子展示:

python 复制代码
# 指定要读取的文件夹路径
input_dir = 'your_directory_with_excel_files'

# 创建一个新的Excel文件保存结果
output_file = 'merged_data.xlsx'

# 读取文件、合并数据并写入新文件
all_data = read_excel_files(input_dir)
merged_data = merge_dataframes(all_data)
write_to_excel(merged_data, output_file)

print(f"恭喜你,所有数据已合并到'{output_file}'!")

记得将 your_directory_with_excel_files 替换为你实际存放Excel文件的文件夹路径。

就这样,通过Python,你不再需要手动一个接一个地打开和粘贴数据了。这不仅提高了效率,还能避免因为手动操作可能出现的错误。快去试试看吧,让你的Excel数据管理变得更简单、更有趣!

相关推荐
2301_763472469 小时前
C++20概念(Concepts)入门指南
开发语言·c++·算法
肖永威9 小时前
macOS环境安装/卸载python实践笔记
笔记·python·macos
TechWJ10 小时前
PyPTO编程范式深度解读:让NPU开发像写Python一样简单
开发语言·python·cann·pypto
枷锁—sha10 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
abluckyboy10 小时前
Java 实现求 n 的 n^n 次方的最后一位数字
java·python·算法
lly20240610 小时前
C++ 文件和流
开发语言
m0_7066532310 小时前
分布式系统安全通信
开发语言·c++·算法
喵手10 小时前
Python爬虫实战:构建各地统计局数据发布板块的自动化索引爬虫(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集数据csv导出·采集各地统计局数据发布数据·统计局数据采集
寻寻觅觅☆11 小时前
东华OJ-基础题-104-A == B ?(C++)
开发语言·c++
lightqjx11 小时前
【C++】unordered系列的封装
开发语言·c++·stl·unordered系列