用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

复制代码
import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

相关推荐
罗政6 小时前
一键对多个Excel文件进行差异内容提取分析+显示差值
excel
qq_381454999 小时前
Python Pandas完全指南:从核心数据结构到实战操作
pandas
罗政10 小时前
AI提取一批Excel单元格内容(快递信息)数据安全,支持断网提取
人工智能·excel
2501_9307077811 小时前
使用C#代码合并或取消合并 Excel 单元格
excel
罗政11 小时前
面向提示词对多Excel,多表单进行“数据分组统计”,“条件合并”,“复杂查询”,“SQL执行”,本地操作,支持百万行表单数据
数据库·sql·excel
无穷小亮20 小时前
Flutter框架跨平台鸿蒙开发——Excel函数教程APP的开发流程
flutter·华为·excel·harmonyos·鸿蒙
开开心心_Every1 天前
家长控制电脑软件:定时锁屏管理使用时长
网络协议·tcp/ip·游戏·微信·pdf·excel·语音识别
TUTO_TUTO1 天前
【python-词汇指标提取工具开发】自学笔记(1)-后端程序
人工智能·python·pandas·visual studio code
技小宝1 天前
Excel网页抓取:批量获取亚马逊商品主图
大数据·经验分享·职场和发展·excel
燕儿_飘飘1 天前
Excel单个表格占用大量空间的问题解决方案
excel·技巧