用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

复制代码
import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

相关推荐
yuhulkjv3359 小时前
ChatGPT Gemini Claude Grok导出的Excel公式失效
人工智能·ai·chatgpt·excel·豆包·deepseek·ai导出鸭
琪伦的工具库11 小时前
批量Excel文件内容组合工具使用说明:按列组合拼接导出TXT/CSV/Excel,支持合并保存与文件预览
excel
zzwq.14 小时前
数据分析三件套:Numpy、Pandas、Matplotlib
数据分析·numpy·pandas
ManageEngineITSM1 天前
IT服务台为什么越忙越低效?
人工智能·自动化·excel·itsm·工单系统
开开心心_Every1 天前
内存清理软件灵活设置,自动阈值快捷键清
运维·服务器·pdf·web3·电脑·excel·共识算法
珍朱(珠)奶茶1 天前
Spring Boot3整合Jxls工具包实现模版excel导出文件
spring boot·后端·excel
七颗糖很甜1 天前
雨滴谱数据深度解析——从原始变量到科学产品的Python实现【下篇】
python·算法·pandas
l1t1 天前
利用uv自带的cpython软件包在离线机器中安装pandas软件
pandas·uv
万粉变现经纪人1 天前
如何解决 pip install ta-lib 报错 本地 TA-Lib 库未安装 问题
数据库·python·scrapy·oracle·bug·pandas·pip