匹配一个文件夹下的所有excel——python

匹配一个文件夹下的所有excel------python(这里写自定义目录标题)

下面展示使用OID匹配所有excel文件的 代码片。这里的OID对应你匹配的基准变量。

首先,保证所有文件中都存在OID,且对应的目标样本相同。

然后,将路径(文件保存地址)和OID换成自己的就可以了

javascript 复制代码
#导入相关库
import os
import pandas as pd

# 设置文件夹路径,这里""中改成你自己的路径
excel_folder = r"C:\Users\lenovo\Desktop\map"

# 获取文件夹中所有 Excel 文件
excel_files = [f for f in os.listdir(excel_folder) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的 DataFrame 用于合并所有结果
merged_df = pd.DataFrame()

# 遍历每个 Excel 文件
for excel_file in excel_files:
    try:
        # 构建文件路径
        excel_path = os.path.join(excel_folder, excel_file)

        # 读取 Excel 文件
        df = pd.read_excel(excel_path)

        # 检查是否包含 'OID' 列
        if 'OID' in df.columns:
            # 如果是第一个文件,则初始化 merged_df
            if merged_df.empty:
                merged_df = df
            else:
                # 基于 'OID' 列进行合并
                merged_df = pd.merge(merged_df, df, on='OID', how='outer')

            print(f"Successfully processed {excel_file}.")
        else:
            print(f"Warning: 'OID' column not found in {excel_file}. Skipping file.")

    except Exception as e:
        print(f"Error processing {excel_file}: {e}")

# 导出合并后的结果到新的 Excel 文件
output_path = os.path.join(excel_folder, "merged_output.xlsx")
merged_df.to_excel(output_path, index=False)

print(f"All processing complete. Results saved to {output_path}")
相关推荐
NiceCloud喜云41 分钟前
Opus 4.8 的 Effort Control 怎么选:Low 到 Max 五档策略
android·java·大数据·前端·c++·python·spring
AI玫瑰助手1 小时前
Python函数:默认参数的定义与注意事项
开发语言·python·信息可视化
weixin_468466851 小时前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
油炸自行车1 小时前
Claude Code 错误:API Error: 400 Failed to deserialize the JSON body into the
开发语言·javascript·json·trae·claude code·api error 400
肩上风骋1 小时前
C++14特性
开发语言·c++·c++14特性
小糖学代码2 小时前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络
智慧物业老杨2 小时前
智慧物业合同周期管理系统:从风险预警到智能交接的全流程数智化落地方案
java·人工智能·python
橙橙笔记2 小时前
Python的学习第一部分
python·学习
JAVA社区3 小时前
Java高级全套教程(十)—— SpringCloudAlibaba超详细实战详解
java·开发语言·spring cloud·面试·职场和发展
弥树子3 小时前
踩坑记录:服务器内网调用接口,真实请求URL与官方公开URL不一致问题排查
开发语言·php