两个表格(Excel/CSV)字段不完全一致,要合并在一起

今天需要将tapd上的数据导出,需要将多个项目的表格合并到一个表格上。

一个表字段 A:

复制代码
状态	优先级	模块	规模	分类	业务价值	父需求	迭代	版本	测试重点	标签	发布计划	需求类别	处理人	开发人员	创建人	产品人员	测试人员	创建时间	最后修改时间	完成时间

另一个表字段 B:

复制代码
ID	标题	状态	优先级	迭代	处理人	预计开始	预计结束	产品人员	测试人员	模块	分类	业务价值	父需求	版本	测试重点	标签	需求类别	创建人	开发人员	创建时间	最后修改时间	完成时间

可以看到:

  • 两个表有 交集字段(比如 状态、优先级、迭代、处理人、产品人员、测试人员...)。
  • 表 B 还有一些额外字段(ID、标题、预计开始、预计结束)。
  • 表 A 有额外字段(规模、发布计划)。

👉 目标:合并成一个总表,字段取 并集,缺失的地方填空值。


Python 处理方法(pandas)

python 复制代码
import pandas as pd

# 读取两个表格
df1 = pd.read_excel("table1.xlsx")
df2 = pd.read_excel("table2.xlsx")

# 字段并集
all_columns = sorted(set(df1.columns) | set(df2.columns))

# 让两个表都补齐相同的字段
df1 = df1.reindex(columns=all_columns)
df2 = df2.reindex(columns=all_columns)

# 合并
merged = pd.concat([df1, df2], ignore_index=True)

# 保存
merged.to_excel("merged.xlsx", index=False)

结果特点

  • merged.xlsx 会包含所有字段:

    复制代码
    ID, 标题, 状态, 优先级, 模块, 规模, 分类, 业务价值, 父需求, 迭代, 版本, 测试重点, 标签, 发布计划, 需求类别, 处理人, 开发人员, 创建人, 产品人员, 测试人员, 创建时间, 最后修改时间, 完成时间, 预计开始, 预计结束
  • 如果某个表没有的字段,合并后就是空值。

相关推荐
小钱c72 小时前
Python使用 pandas操作Excel文件并新增列数据
python·excel·pandas
Shi_haoliu4 小时前
Vue2 + Office Add-in关于用vue项目于加载项控制excel单元格内容(Demo版)
前端·javascript·vue.js·node.js·html·excel·office
njsgcs4 小时前
json转excel python pd
python·json·excel·pd
RECRUITGUY5 小时前
Excel中将毫秒时间戳转换为标准时间格式
excel
SunkingYang7 小时前
详细介绍C++中捕获异常类型的方式有哪些,分别用于哪些情形,哪些异常捕获可用于通过OLE操作excel异常
c++·excel·mfc·异常捕获·comerror
lied166363480613 小时前
List导出到Excel文件
servlet·list·excel
ZhengEnCi19 小时前
Excel 文件结构完全指南-从基础概念到 Python 读取的实用宝典
python·excel
核桃杏仁粉21 小时前
excel拼接数据库
数据库·oracle·excel
cx330上的猫21 小时前
价值1w的数据分析课知识点汇总-excel使用(第一篇)
数据挖掘·数据分析·excel
小薛引路1 天前
office便捷办公06:根据相似度去掉excel中的重复行
windows·python·excel