两个表格(Excel/CSV)字段不完全一致,要合并在一起

今天需要将tapd上的数据导出,需要将多个项目的表格合并到一个表格上。

一个表字段 A:

复制代码
状态	优先级	模块	规模	分类	业务价值	父需求	迭代	版本	测试重点	标签	发布计划	需求类别	处理人	开发人员	创建人	产品人员	测试人员	创建时间	最后修改时间	完成时间

另一个表字段 B:

复制代码
ID	标题	状态	优先级	迭代	处理人	预计开始	预计结束	产品人员	测试人员	模块	分类	业务价值	父需求	版本	测试重点	标签	需求类别	创建人	开发人员	创建时间	最后修改时间	完成时间

可以看到:

  • 两个表有 交集字段(比如 状态、优先级、迭代、处理人、产品人员、测试人员...)。
  • 表 B 还有一些额外字段(ID、标题、预计开始、预计结束)。
  • 表 A 有额外字段(规模、发布计划)。

👉 目标:合并成一个总表,字段取 并集,缺失的地方填空值。


Python 处理方法(pandas)

python 复制代码
import pandas as pd

# 读取两个表格
df1 = pd.read_excel("table1.xlsx")
df2 = pd.read_excel("table2.xlsx")

# 字段并集
all_columns = sorted(set(df1.columns) | set(df2.columns))

# 让两个表都补齐相同的字段
df1 = df1.reindex(columns=all_columns)
df2 = df2.reindex(columns=all_columns)

# 合并
merged = pd.concat([df1, df2], ignore_index=True)

# 保存
merged.to_excel("merged.xlsx", index=False)

结果特点

  • merged.xlsx 会包含所有字段:

    复制代码
    ID, 标题, 状态, 优先级, 模块, 规模, 分类, 业务价值, 父需求, 迭代, 版本, 测试重点, 标签, 发布计划, 需求类别, 处理人, 开发人员, 创建人, 产品人员, 测试人员, 创建时间, 最后修改时间, 完成时间, 预计开始, 预计结束
  • 如果某个表没有的字段,合并后就是空值。

相关推荐
SamDeepThinking4 小时前
基于CompletableFuture的主子任务并行处理架构实战:多渠道账单并发导入性能提升5倍的技术方案
java·后端·excel
SamDeepThinking4 小时前
88MB Excel文件导致系统崩溃?看我如何将内存占用降低
java·excel
ChrisitineTX4 小时前
警惕数据“陷阱”:Python 如何自动发现并清洗 Excel 中的异常值?
开发语言·python·excel
wtsolutions5 小时前
Excel to JSON by WTSolutions 4.0.0 版本更新公告
json·excel·wps·插件·转换·加载项·wtsolutions
wtsolutions5 小时前
Excel to JSON by WTSolutions 4.0.0 Update Announcement
json·excel·wps·addin·wtsolutions·conversion
癫狂的兔子1 天前
【Office】【Excel】常用函数公式总结
excel
毛飞龙1 天前
Excel迷你图:在单元格中嵌入趋势洞察
excel·迷你图·sparklines
Tatalaluola1 天前
Unity使用EPPlus读取写入表格
unity·c#·游戏引擎·excel
缺点内向1 天前
如何在 C# 中将 Excel 工作表拆分为多个窗格
开发语言·c#·.net·excel
Williams102 天前
Java POI/Excel工具:终结OOM、精度丢失和i18n三大难题
java·开发语言·excel