使用pandas实现合并具有共同列的两个EXCEL表

表1:

表2:

表1和表2,有共同的列"名称",而且,表1的内容(行数)<=表2的行数。

目的,根据"名称"列的对应内容,将表2列中的"所处行业"填写到表1相应的位置。

实现代码:

复制代码
import pandas as pd

csv_file_path_a = '表1.csv'  # 替换为你的CSV文件路径
csv_file_path_b = '表2.csv'  # 替换为你的CSV文件路径
df_a = pd.read_csv(csv_file_path_a, encoding='gbk')
df_b = pd.read_csv(csv_file_path_b, encoding='gbk')

df_merged = pd.merge(df_a, df_b[['名称', '所处行业']], on='名称', how='left')
df_merged.to_csv('合并结果.csv', index=False, encoding='gbk')

结果(生成一个新的叫做"合并结果.csv"),如下图:

关键代码解释:

复制代码
on='名称':以"名称"列为匹配键。

how='left':保留第一个表(df1)中的所有行,只添加匹配上的"所处行业"。

df2[['名称', '所处行业']]:只取 df2 中需要的列,避免多余列混入。
相关推荐
大数据魔法师13 小时前
云南省天气数据可视化分析大屏的设计与实现(二)- 云南省各城市天气数据预处理
python·mysql·pandas
fengyehongWorld13 小时前
VBA 操作PowerQuery表格和带名字的表格
excel·vba
Hello.Reader14 小时前
Apache Arrow 在 PySpark 中的使用提速 Pandas 转换与 UDF 的关键武器
apache·pandas
tangyal14 小时前
Linux 核心操作合集(网络配置、XShell远程连接、vim文本编辑与操作、权限管理 实操手册)
excel
Hello.Reader14 小时前
Pandas API on Spark 配置选项系统、默认索引与性能调优
大数据·spark·pandas
softbangong1 天前
815-批量Excel文件合并工具,批量excel文件、工作表合并软件
linux·windows·excel·文件合并·excel合并·数据整理
城数派1 天前
2000-2024年1km精度人口分布栅格数据(全球/全国/分省/分市)
arcgis·信息可视化·数据分析·excel
城数派1 天前
1984-2024年中国10米分辨率城市土地利用栅格数据(商业、公服、居住等9类)
arcgis·信息可视化·数据分析·excel
城数派1 天前
2015-2024年我国1km分辨率逐日地表温度(LST)栅格数据
数据库·arcgis·信息可视化·数据分析·excel
城数派1 天前
中国全国土壤有机碳密度数据集(2010-2024年)
数据库·arcgis·信息可视化·数据分析·excel