Excel文件处理excel内容

针对这个Excel文件处理需求,请输出一个Python脚本:根据Excel文档内容,输出一个新的Excel,按每个sheet一样的命名新Excel的sheet,每个sheet里的内容与原Excel的对应关系如下:登陆账号='经办人司库账号'或'审核人司库号';用户名称='经办人名称'或'审核人名称';所属组织编码='单位编号';所属角色编码=经办人填充0002,审核人填充0004;注意统一登录账号的经办人或者审核人会存在多个组织或角色中,则所属组织编码、所属角色编码用逗号隔离罗列在同一账号姓名人员里即可。

python 复制代码
import pandas as pd

def process_sheet(df, sheet_name, output_writer):
    # 添加新的列
    df['所属组织编码'] = df['单位编码']
    df['所属角色编码'] = None

    # 将经办人和审核人的信息合并到同一个 DataFrame 中
    if '审核人司库号' in df.columns and '审核人名称' in df.columns:
        df['审核人司库号'].fillna('', inplace=True)
        df['审核人名称'].fillna('', inplace=True)
        df = pd.concat([df, df[['审核人司库号', '审核人名称', '单位编码']].rename(columns={'审核人司库号': '经办人司库账号', '审核人名称': '经办人名称'})], ignore_index=True)

    # 根据经办人账号分组
    grouped = df.groupby('经办人司库账号')

    # 创建一个新的 DataFrame 来存储结果
    result_df = []

    for account, group in grouped:
        # 对于每个账号,获取唯一的姓名
        name = group['经办人名称'].iloc[0]

        # 获取所有相关的单位编码和角色编码
        org_codes = group['单位编码'].unique()
        role_codes = ['0002'] * len(org_codes)  # 经办人角色编码

        # 如果有审核人的信息,添加审核人的角色编码
        if '审核人司库号' in df.columns:
            role_codes += ['0004'] * len(org_codes)  # 审核人角色编码

        # 合并组织编码和角色编码
        org_code_str = ','.join(map(str, org_codes))
        role_code_str = ','.join(map(str, role_codes))

        # 添加一行到结果 DataFrame
        result_df.append({
            '登陆账号': account,
            '用户名称': name,
            '所属组织编码': org_code_str,
            '所属角色编码': role_code_str
        })

    # 将结果转换为 DataFrame
    result_df = pd.DataFrame(result_df)

    # 写入新的 Excel 文件
    result_df.to_excel(output_writer, sheet_name=sheet_name, index=False)

def process_excel(input_file, output_file):
    # 读取原始 Excel 文件
    excel = pd.ExcelFile(input_file)

    # 创建 ExcelWriter 对象用于写入结果
    with pd.ExcelWriter(output_file, engine='openpyxl') as writer:
        for sheet_name in excel.sheet_names:
            df = pd.read_excel(input_file, sheet_name=sheet_name)
            process_sheet(df, sheet_name, writer)

# 指定输入和输出文件路径
input_file = 'D:\\input.xlsx'  # 原始文件路径
output_file = 'D:\\processed_data.xlsx'  # 输出文件路径

# 执行处理
process_excel(input_file, output_file)
相关推荐
武子康1 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康2 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP3 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库3 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟3 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人3 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长3 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计
B站计算机毕业设计超人3 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
十月南城3 天前
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
大数据·数据库·数据仓库·hive·hadoop·spark
中烟创新3 天前
灯塔AI智能体获评“2025-2026中国数智科技年度十大创新力产品”
大数据·人工智能·科技