用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

复制代码
import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

相关推荐
Lucky高2 小时前
Pandas库入门
python·pandas
oh,huoyuyan5 小时前
【界面案例】火语言RPA读取Excel文件,循环写入界面表格
excel·rpa
占疏9 小时前
df数据 按列 提取为单个列表
pandas
qq_2147826111 小时前
pandas“将”迎来v3.0.0大版本更新!
python·pandas
2501_9071368213 小时前
Excel数据根据标题行自动匹配合并到指定模板文件
excel·软件需求
分***814 小时前
批量识别身份证并导出excel工具分享,身份证识别工具离线识别 + 字段精准优化,Win10/11 直接用
excel·身份证识别
runepic15 小时前
Python 批量合并多个 Excel 数据(自动补 0 + 生成明细)
java·python·excel
hellotutu15 小时前
Java 读取 Excel 文件
java·开发语言·excel
yivifu15 小时前
Excel中Lookup函数实现临界点归入下一个等级的方法
java·前端·excel
SunnyDays101115 小时前
使用 Python 冻结、取消冻结和拆分 Excel 窗格
python·excel·冻结窗格·冻结行和列·取消冻结窗格·拆分窗格