python合并excel

0 思路

注意:此代码1,2是将多个excel合并到一个excel,3是根据某个键进行合并,针对键的合并需要使用merge函数,实现excel的vlookup功能

主要使用pandas操作excel,然后写入excel表

  1. pandas读取excel后数据类型是pd.DataFrame

  2. 将循环遍历的表都添加到一个DataFrame中

  3. 然后保存到excel

1. 多个文件读取合并

python 复制代码
'''
author : SnowMaple
time : 2023/11/30 9:24
'''

import pandas as pd 
import os import re # 用于存储所有要合并的Excel文件的文件名 

excel_files = ["1.xlsx", "2.xlsx", "3.xlsx","5.xlsx","6.xlsx"] # 创建一个用于存储所有数据的 combined_data = pd.DataFrame() # 逐个读取每个Excel文件的第一个sheet并合并 
for file in excel_files: 
    if os.path.isfile(file): # 确保文件存在 
        df = pd.read_excel(file, sheet_name=0) # 读取第一个sheet
        combined_data = combined_data.append(df, ignore_index=True) # 创建一个新的Excel文件来保存合并后的数据 
output_file = "combined_data3.xlsx"
combined_data.to_excel(output_file, index=False) 
print(f"合并后的数据已保存到 {output_file}")

2. 遍历文件夹读取

python 复制代码
'''
author : SnowMaple
time : 2023/11/30 9:24
'''

import pandas as pd
import os
import re

# 用于存储所有要合并的Excel文件的文件名

pattern = re.compile(r"^\d")
# 创建一个用于存储所有数据的DataFrame
folder_path = "C:/kaggle_data/titanic"
combined_data = pd.DataFrame()
for filename in os.listdir(folder_path):
    if filename.endswith(".xlsx") and pattern.search(filename):
        print(filename)
        df = pd.read_excel(filename, sheet_name=0)  # 读取第一个sheet
        combined_data = combined_data.append(df, ignore_index=True)
        

# 创建一个新的Excel文件来保存合并后的数据
output_file = "combined_data3.xlsx"
combined_data.to_excel(output_file, index=False)

print(f"合并后的数据已保存到 {output_file}")

3. 实现vlookup功能

根据某个键合并

python 复制代码
'''
author : SnowMaple
time : 2023/11/30
'''

import pandas as pd
# 1. 读数据
A = pd.read_excel('.\厦门XXXXX有限公司_20230XXXXX3351.xlsx') 
#也可指定列名 converters={"列名1":str, "列名2":str}
B = pd.read_excel('.\XXXXX明细.xlsx')

# 2. 数据预处理:注意A表和B表指定合并的键要一致
B= B.rename(columns={"号码":"serial_number"})

# 3. 合并 写入excel中
df = pd.merge(left=A, right=B, on="serial_number", how="outer")
df.to_excel("1129.xlsx")
相关推荐
你才是向阳花27 分钟前
如何用Python实现飞机大战小游戏
开发语言·python·pygame
草莓熊Lotso41 分钟前
C++ 方向 Web 自动化测试实战:以博客系统为例,从用例到报告全流程解析
前端·网络·c++·人工智能·后端·python·功能测试
程序员爱钓鱼1 小时前
Python编程实战——Python实用工具与库:Pandas数据处理
后端·python·ipython
程序员爱钓鱼1 小时前
Python编程实战——Python实用工具与库:Numpy基础
后端·python·面试
程序员霸哥哥1 小时前
从零搭建PyTorch计算机视觉模型
人工智能·pytorch·python·计算机视觉
晚秋大魔王2 小时前
基于python的jlink单片机自动化批量烧录工具
前端·python·单片机
胖哥真不错2 小时前
Python基于PyTorch实现多输入多输出进行CNN卷积神经网络回归预测项目实战
pytorch·python·毕业设计·课程设计·毕设·多输入多输出·cnn卷积神经网络回归预测
程序员-小李2 小时前
基于PyTorch的动物识别模型训练与应用实战
人工智能·pytorch·python
zhangyao9403305 小时前
关于js导入Excel时,Excel的(年/月/日)日期是五位数字的问题。以及对Excel日期存在的错误的分析和处理。
开发语言·javascript·excel
闲人编程5 小时前
Python在网络安全中的应用:编写一个简单的端口扫描器
网络·python·web安全·硬件·端口·codecapsule·扫描器