将每个Excel文件的数据量统一减少至120000行

为了将每个Excel文件的数据量统一减少至120000行,可以使用Python的pandas库来加载、修改和保存每个文件。以下是一个简单的Python脚本:

首先,确保已经安装了pandas库,如果没有安装,可以通过以下命令安装:

py 复制代码
pip install pandas

接下来是处理数据的代码:

python 复制代码
import os
import pandas as pd

def trim_excel_files(root_dir, max_rows=120000-1):
    # 遍历根目录下的所有子目录
    for condition_dir in os.listdir(root_dir):
        condition_path = os.path.join(root_dir, condition_dir)
        if os.path.isdir(condition_path):
            # 遍历每个工况目录下的所有Excel文件
            for file in os.listdir(condition_path):
                if file.endswith('.xlsx'):
                    file_path = os.path.join(condition_path, file)
                    # 读取Excel文件
                    df = pd.read_excel(file_path)
                    # 如果行数超过120000,进行缩减
                    if len(df) > max_rows:
                        df = df.iloc[:max_rows]
                    # 保存修改后的数据到原文件
                    df.to_excel(file_path, index=False)
                    print(f"Processed {file_path}")

# 指定数据所在的根目录
root_dir = './程序代码1/data'
trim_excel_files(root_dir)

这个脚本首先定义了一个trim_excel_files函数,它接收一个包含数据文件的根目录作为参数。该函数将遍历根目录下的所有子目录,读取每个.xlsx文件,检查其中的行数,如果超过120000行,则将其缩减至120000行,并将修改后的数据保存回原文件。这个过程会替换掉原有的文件,请确保有备份或是可以接受这种替换。

相关推荐
扶尔魔ocy17 分钟前
python程序打包成win的exe应用(以OCR应用为例)
python·ocr·中文识别
Psycho_MrZhang26 分钟前
自定义层和读写文件
pytorch·python·深度学习
似水流年 光阴已逝1 小时前
从Excel姓名匹配案例学Python:由点及面的系统化学习指南
开发语言·python·excel
这里有鱼汤1 小时前
量化的困局:当所有人都在跑同一个因子时,我们还能赚谁的钱?
后端·python
新子y1 小时前
【小白笔记】strip的含义
笔记·python
Q_Q19632884751 小时前
python+vue的在线租房 房屋租赁系统
开发语言·vue.js·spring boot·python·django·flask·node.js
空影星1 小时前
GridPlayer,一个好用的多视频同步播放器
python·flask·电脑·音视频
哥布林学者1 小时前
吴恩达深度学习课程一:神经网络和深度学习 第三周:浅层神经网络(三)
深度学习·ai
MIXLLRED2 小时前
YOLO学习——训练进阶和预测评价指标
深度学习·学习·yolo
草莓熊Lotso2 小时前
《C++ Web 自动化测试实战:常用函数全解析与场景化应用指南》
前端·c++·python·dubbo