针对这个Excel文件处理需求,请输出一个Python脚本:根据Excel文档内容,输出一个新的Excel,按每个sheet一样的命名新Excel的sheet,每个sheet里的内容与原Excel的对应关系如下:登陆账号='经办人司库账号'或'审核人司库号';用户名称='经办人名称'或'审核人名称';所属组织编码='单位编号';所属角色编码=经办人填充0002,审核人填充0004;注意统一登录账号的经办人或者审核人会存在多个组织或角色中,则所属组织编码、所属角色编码用逗号隔离罗列在同一账号姓名人员里即可。
python
import pandas as pd
def process_sheet(df, sheet_name, output_writer):
# 添加新的列
df['所属组织编码'] = df['单位编码']
df['所属角色编码'] = None
# 将经办人和审核人的信息合并到同一个 DataFrame 中
if '审核人司库号' in df.columns and '审核人名称' in df.columns:
df['审核人司库号'].fillna('', inplace=True)
df['审核人名称'].fillna('', inplace=True)
df = pd.concat([df, df[['审核人司库号', '审核人名称', '单位编码']].rename(columns={'审核人司库号': '经办人司库账号', '审核人名称': '经办人名称'})], ignore_index=True)
# 根据经办人账号分组
grouped = df.groupby('经办人司库账号')
# 创建一个新的 DataFrame 来存储结果
result_df = []
for account, group in grouped:
# 对于每个账号,获取唯一的姓名
name = group['经办人名称'].iloc[0]
# 获取所有相关的单位编码和角色编码
org_codes = group['单位编码'].unique()
role_codes = ['0002'] * len(org_codes) # 经办人角色编码
# 如果有审核人的信息,添加审核人的角色编码
if '审核人司库号' in df.columns:
role_codes += ['0004'] * len(org_codes) # 审核人角色编码
# 合并组织编码和角色编码
org_code_str = ','.join(map(str, org_codes))
role_code_str = ','.join(map(str, role_codes))
# 添加一行到结果 DataFrame
result_df.append({
'登陆账号': account,
'用户名称': name,
'所属组织编码': org_code_str,
'所属角色编码': role_code_str
})
# 将结果转换为 DataFrame
result_df = pd.DataFrame(result_df)
# 写入新的 Excel 文件
result_df.to_excel(output_writer, sheet_name=sheet_name, index=False)
def process_excel(input_file, output_file):
# 读取原始 Excel 文件
excel = pd.ExcelFile(input_file)
# 创建 ExcelWriter 对象用于写入结果
with pd.ExcelWriter(output_file, engine='openpyxl') as writer:
for sheet_name in excel.sheet_names:
df = pd.read_excel(input_file, sheet_name=sheet_name)
process_sheet(df, sheet_name, writer)
# 指定输入和输出文件路径
input_file = 'D:\\input.xlsx' # 原始文件路径
output_file = 'D:\\processed_data.xlsx' # 输出文件路径
# 执行处理
process_excel(input_file, output_file)