通过关键词合并2张excel表格——Python代码实现

问题描述

2个excel表格中都包含了一个共同的关键字【单品编码】,如何将2个表通过该关键字合并为一张表格。使用Python代码完成该任务。

1.数据说明

附件1中的数据excel格式

c 复制代码
销售日期,扫码销售时间,单品编码,销量(千克),销售单价(元/千克),销售类型,是否打折销售
2020-07-01,09:15:07.924,102900005117056,0.396 ,7.60 ,销售,否
2020-07-01,09:17:27.295,102900005115960,0.849 ,3.20 ,销售,否
2023-03-30,15:06:08.514,102900011030097,1.000 ,4.50 ,销售,否
2023-03-30,15:08:15.868,102900005116257,0.584 ,8.60 ,销售,否
2023-06-30,21:35:21.509,102900011016701,0.252 ,5.20 ,销售,否
2023-06-30,21:40:48.248,102900011022764,0.803 ,12.00 ,销售,否

附件2中的数据excel格式

c 复制代码
单品编码,单品名称,分类编码,分类名称
102900005117056,牛首生菜,1011010101,花叶类
102900005115960,四川红香椿,1011010101,花叶类
102900005115625,本地小毛白菜,1011010101,花叶类
102900005115748,白菜苔,1011010101,花叶类
102900011030097,藕,1011010402,水生根茎类
102900005116257,净藕(1),1011010402,水生根茎类
102900005118824,高瓜(1),1011010402,水生根茎类
102900011001561,莲蓬(个),1011010402,水生根茎类
102900011016701,紫茄子(2),1011010501,茄类
102900011022764,青茄子(1),1011010501,茄类
102900011000335,紫圆茄,1011010501,茄类
102900011009444,大龙茄子,1011010501,茄类

2.Python代码复现

c 复制代码
import pandas as pd

filepath1 = 'C:/Users/14210/Desktop/机器学习代码/data/附件1.xlsx'
filepath2 = 'C:/Users/14210/Desktop/机器学习代码/data/附件2.xlsx'

Sheet_key1 = pd.read_excel(filepath1)
Sheet_key2 = pd.read_excel(filepath2)
print('主键合并前Sheet_key1的大小为:', Sheet_key1.shape, '\n', 
      '主键合并前Sheet_key2的大小为:', Sheet_key2.shape)

Sheet_key = pd.merge(Sheet_key1, Sheet_key2, left_on='单品编码', right_on = '单品编码')

#将合并后的DataFrame数据保存为excel文档。
Sheet_key.to_excel("C:/Users/14210/Desktop/机器学习代码/data/output.xlsx", index=False) 

print('主键合并后数据框为:\n', Sheet_key, '\n', 
      '主键合并后数据框大小为:', Sheet_key.shape)

3.复现结果展示

终于成功了,该数据集使用了2023年全国大学生数学建模大赛C题中的附件1和附件2.

相关推荐
喵手4 小时前
Python爬虫实战:旅游数据采集实战 - 携程&去哪儿酒店机票价格监控完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集结果csv导出·旅游数据采集·携程/去哪儿酒店机票价格监控
2501_944934734 小时前
高职大数据技术专业,CDA和Python认证优先考哪个?
大数据·开发语言·python
helloworldandy4 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
肖永威5 小时前
macOS环境安装/卸载python实践笔记
笔记·python·macos
TechWJ6 小时前
PyPTO编程范式深度解读:让NPU开发像写Python一样简单
开发语言·python·cann·pypto
枷锁—sha6 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
abluckyboy6 小时前
Java 实现求 n 的 n^n 次方的最后一位数字
java·python·算法
喵手6 小时前
Python爬虫实战:构建各地统计局数据发布板块的自动化索引爬虫(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集数据csv导出·采集各地统计局数据发布数据·统计局数据采集
天天爱吃肉82187 小时前
跟着创意天才周杰伦学新能源汽车研发测试!3年从工程师到领域专家的成长秘籍!
数据库·python·算法·分类·汽车
m0_715575347 小时前
使用PyTorch构建你的第一个神经网络
jvm·数据库·python