用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

相关推荐
Excel_easy3 小时前
WPS按双字段拆分工作表到独立工作簿-Excel易用宝
excel·wps
JavaNice哥17 小时前
easyexcel读取写入excel easyexceldemo
excel
Johaden17 小时前
EXCEL+Python搞定数据处理(第一部分:Python入门-第2章:开发环境)
开发语言·vscode·python·conda·excel
进击的雷神20 小时前
Excel 实现文本拼接方法
excel
东京老树根20 小时前
Excel 技巧15 - 在Excel中抠图头像,换背景色(★★)
笔记·学习·excel
史嘉庆21 小时前
Pandas 数据分析(二)【股票数据】
大数据·数据分析·pandas
规划GIS会1 天前
CC工具箱使用指南:【Excel点集转面要素(批量)】
excel·二次开发·arcgis pro
东京老树根1 天前
Excel 技巧17 - 如何计算倒计时,并添加该倒计时的数据条(★)
笔记·学习·excel
符小易1 天前
Mac苹果电脑 怎么用word文档和Excel表格?
macos·word·excel
liuweidong08021 天前
【Pandas】pandas Series rolling
pandas