用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

复制代码
import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

相关推荐
热河暖男1 小时前
【实战解决方案】Spring Boot+Redisson构建高并发Excel导出服务,彻底解决系统阻塞难题
spring boot·后端·excel
lisw054 小时前
Python高级进阶:Vim与Vi使用指南
python·vim·excel
东方巴黎~Sunsiny8 小时前
EasyExcel导出excel再转PDF转图片详解
pdf·excel
Winter_world9 小时前
Excel中批量对多个结构相同的工作表执行操作,可以使用VBA宏来实现
excel·excel批量sheet操作
慧一居士10 小时前
EasyExcel集成使用总结与完整示例
java·excel
零凌林10 小时前
使用exceljs将excel文件转化为html预览最佳实践(完整源码)
前端·html·excel·vue3·最佳实践·文件预览·exceljs
晨曦backend12 小时前
EXCEL下拉菜单与交替上色设置
excel
执笔写回憶1 天前
Excel在每行下面插入数量不等的空行
excel
CodeJourney.2 天前
ChemBlender:科研绘图创新解决方案
数据库·人工智能·信息可视化·excel
olllo.top2 天前
从 Excel 到 Data.olllo:数据分析师的提效之路
数据分析·excel