Python批量将Excel内指定列的数据向上移动一行

本文介绍基于Python 语言,针对一个文件夹 下大量的Excel 表格文件,对其中的每一个文件 加以操作------将其中指定的若干列 的数据部分都向上移动一行,并将所有操作完毕的Excel 表格文件中的数据加以合并,生成一个新的Excel文件的方法。

首先,我们明确一下本文的需求。在一个文件夹内,有大量的Excel 表格文件(以.csv格式文件为例),其中每一个文件都有着类似如下图所示的数据特征;我们希望,对于下图中紫色框内的列,其中的数据部分 (每一列都有一个列名 ,这个列名不算做数据部分 )都向上提升一行(比如原本数据部分的第2行变到第1行,原本第3行变到第2行,以此类推)。

由上图也可以看到,需要加以数据操作的列 ,有的在原本数据部分的第1行就没有数据,而有的在原本的数据部分中第1行也有数据;对于后者,我们在数据向上提升一行之后,相当于原本第1行的数据就被覆盖掉了。此外,很显然在每一个文件的操作结束后,加以处理的列 的数据部分的最后一行 肯定是没有数据的;因此在合并全部操作后的文件之前,还希望将每一个操作后文件最后一行删除。

知道了需求,我们就可以开始代码的撰写;具体代码如下。

python 复制代码
# -*- coding: utf-8 -*-
"""
Created on Fri May 19 01:47:06 2023

@author: fkxxgis
"""

import os
import pandas as pd

original_path = "E:/01_Reflectivity/25_2022Data_New"
result_path = "E:/01_Reflectivity/26_Train_Model_New"

result_df = pd.DataFrame()

for file in os.listdir(original_path):
    if file.endswith(".csv"):
        
        df = pd.read_csv(os.path.join(original_path, file))
        columns_move_index = list(range(8, 16)) + list(range(17, 36))
        for columns_index in columns_move_index:
            for i in range(len(df) - 1):
                df.iat[i, columns_index] = df.iat[i + 1, columns_index]
        if len(df):
            df = df.drop(len(df) - 1)
        # df = df.iloc[ : , 1 : ]
        result_df = pd.concat([result_df, df])
        
result_df.to_csv(os.path.join(result_path, "Train_Model_0715_Main.csv"), index = False)

其中,original_path表示存放有多个待处理的Excel 表格文件的文件夹路径,result_path则是结果Excel表格文件的存放路径。

首先,我们通过result_df = pd.DataFrame()创建一个空的DataFrame ,用于保存处理后的数据。接下来,遍历原始文件夹中的所有文件,并找到文件夹内以.csv结尾的文件;随后,读取这些.csv文件,并将其保存到df中。

其次,我们通过columns_move_index = list(range(8, 16)) + list(range(17, 36))指定需要移动数据的列的索引范围,并随后遍历需要移动数据的列。接下来的df.iat[i, columns_index] = df.iat[i + 1, columns_index]表示将当前行的数据替换为下一行对应的数据。

接下来,我们通过if len(df):判断是否DataFrame 不为空,如果是的话就删除DataFrame 中的最后一行数据;随后,将处理后的DataFrame 连接到result_df中。

最后,我们通过result_df.to_csv()函数,将最终处理后的DataFrame 保存为一个新的Excel表格文件,从而完成我们的需求。

至此,大功告成。

欢迎关注:疯狂学习GIS

相关推荐
l1t36 分钟前
用wsl自带的python 3.10下载适用于3.12的pandas版本结合uv安装python 3.12模拟离线安装场景
python·pandas·uv
飞Link1 小时前
【AI大模型实战】万字长文肝透大语言模型(LLM):从底层原理解析到企业级Python项目落地
开发语言·人工智能·python·语言模型·自然语言处理
翻斗包菜1 小时前
第 03 章 Python 操作 MySQL 数据库实战全解
数据库·python·mysql
xcjbqd01 小时前
如何修改Oracle服务器默认的日期格式_NLS_DATE_FORMAT全局配置
jvm·数据库·python
yuhulkjv3351 小时前
AI导出的Excel公式失效
人工智能·ai·chatgpt·excel·豆包·deepseek·ai导出鸭
white-persist1 小时前
【vulhub spring CVE-2018-1270】CVE-2018-1270 Spring Messaging 远程命令执行漏洞 完整复现详细分析解释
java·服务器·网络·数据库·后端·python·spring
EnCi Zheng2 小时前
P2G-Python字符串方法完全指南-split、join、strip、replace的Python编程利器
开发语言·python
潇洒畅想2 小时前
1.1 从∑到∫:用循环理解求和与累积
java·数据结构·python·算法
有一个好名字2 小时前
Claude Code 50+命令全解析
python
liliangcsdn2 小时前
LLM如何与mcp server交互示例
linux·开发语言·python