用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

复制代码
import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

相关推荐
办公解码器1 小时前
Excel怎么将八位数字设置为日期格式?
excel
gis91 小时前
批量地址解析坐标,支持WPS、EXCEL软件,支持导出SHP、GEOJSON、DXF等文件格式
excel·wps
赵庆明老师2 小时前
ASP.NET Core读取Excel文件
excel
luyun0202025 小时前
流批了,pdf批量转excel
windows·pdf·excel·figma
老师可可5 小时前
成绩发布工具使用方法,附成绩分析教程
学习·信息可视化·小程序·excel·学习方法
SamDeepThinking11 小时前
处理大型excel文件的技术选型
excel
技术钱1 天前
vue3前端解析excel文件
前端·vue.js·excel
VBAMatrix1 天前
数据重构!按一级科目拆分序时账,批量生成明细账
excel·财务·审计·会计师事务所·tb工具箱·明细账
缺点内向1 天前
Java 使用 Spire.XLS 库合并 Excel 文件实践
java·开发语言·excel
焚 城1 天前
EXCEL(带图)转html【uni版】
前端·html·excel