两个表格(Excel/CSV)字段不完全一致,要合并在一起

今天需要将tapd上的数据导出,需要将多个项目的表格合并到一个表格上。

一个表字段 A:

复制代码
状态	优先级	模块	规模	分类	业务价值	父需求	迭代	版本	测试重点	标签	发布计划	需求类别	处理人	开发人员	创建人	产品人员	测试人员	创建时间	最后修改时间	完成时间

另一个表字段 B:

复制代码
ID	标题	状态	优先级	迭代	处理人	预计开始	预计结束	产品人员	测试人员	模块	分类	业务价值	父需求	版本	测试重点	标签	需求类别	创建人	开发人员	创建时间	最后修改时间	完成时间

可以看到:

  • 两个表有 交集字段(比如 状态、优先级、迭代、处理人、产品人员、测试人员...)。
  • 表 B 还有一些额外字段(ID、标题、预计开始、预计结束)。
  • 表 A 有额外字段(规模、发布计划)。

👉 目标:合并成一个总表,字段取 并集,缺失的地方填空值。


Python 处理方法(pandas)

python 复制代码
import pandas as pd

# 读取两个表格
df1 = pd.read_excel("table1.xlsx")
df2 = pd.read_excel("table2.xlsx")

# 字段并集
all_columns = sorted(set(df1.columns) | set(df2.columns))

# 让两个表都补齐相同的字段
df1 = df1.reindex(columns=all_columns)
df2 = df2.reindex(columns=all_columns)

# 合并
merged = pd.concat([df1, df2], ignore_index=True)

# 保存
merged.to_excel("merged.xlsx", index=False)

结果特点

  • merged.xlsx 会包含所有字段:

    复制代码
    ID, 标题, 状态, 优先级, 模块, 规模, 分类, 业务价值, 父需求, 迭代, 版本, 测试重点, 标签, 发布计划, 需求类别, 处理人, 开发人员, 创建人, 产品人员, 测试人员, 创建时间, 最后修改时间, 完成时间, 预计开始, 预计结束
  • 如果某个表没有的字段,合并后就是空值。

相关推荐
程序员敲代码吗8 小时前
Go语言中Channel的实现与内存通信机制详解
excel
时空自由民.12 小时前
vim入门配置教程
编辑器·vim·excel
_院长大人_14 小时前
Java Excel导出:如何实现自定义表头与字段顺序的完全控制
java·开发语言·后端·excel
Cloud_Shy61818 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十一章 Python 包跟踪器 下篇)
前端·后端·python·数据分析·excel
asdzx6720 小时前
使用 C# 打印 Excel 文档(详细教程)
c#·excel
vennnnnnnnnnnnnn20 小时前
Excel 导入原文保留与内联排名配置问题复盘
前端·数据库·excel
anlog21 小时前
Excel返回或设置边框、字体或内部颜色
excel·背景色
工具怪1 天前
Excel 如何加水印?4种常见使用场景与操作步骤
excel
写了20年代码的老程序员2 天前
Excel 导入导出为什么总是把后端逼成字段搬运工
java·excel
Cloud_Shy6182 天前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十一章 Python 包跟踪器 中篇)
数据库·python·sql·数据分析·excel·web