将每个Excel文件的数据量统一减少至120000行

为了将每个Excel文件的数据量统一减少至120000行,可以使用Python的pandas库来加载、修改和保存每个文件。以下是一个简单的Python脚本:

首先,确保已经安装了pandas库,如果没有安装,可以通过以下命令安装:

py 复制代码
pip install pandas

接下来是处理数据的代码:

python 复制代码
import os
import pandas as pd

def trim_excel_files(root_dir, max_rows=120000-1):
    # 遍历根目录下的所有子目录
    for condition_dir in os.listdir(root_dir):
        condition_path = os.path.join(root_dir, condition_dir)
        if os.path.isdir(condition_path):
            # 遍历每个工况目录下的所有Excel文件
            for file in os.listdir(condition_path):
                if file.endswith('.xlsx'):
                    file_path = os.path.join(condition_path, file)
                    # 读取Excel文件
                    df = pd.read_excel(file_path)
                    # 如果行数超过120000,进行缩减
                    if len(df) > max_rows:
                        df = df.iloc[:max_rows]
                    # 保存修改后的数据到原文件
                    df.to_excel(file_path, index=False)
                    print(f"Processed {file_path}")

# 指定数据所在的根目录
root_dir = './程序代码1/data'
trim_excel_files(root_dir)

这个脚本首先定义了一个trim_excel_files函数,它接收一个包含数据文件的根目录作为参数。该函数将遍历根目录下的所有子目录,读取每个.xlsx文件,检查其中的行数,如果超过120000行,则将其缩减至120000行,并将修改后的数据保存回原文件。这个过程会替换掉原有的文件,请确保有备份或是可以接受这种替换。

相关推荐
有Li2 分钟前
CLIK-Diffusion:用于牙齿矫正的临床知识感知扩散模型|文献速递-深度学习人工智能医疗图像
人工智能·深度学习·文献·医学生
有梦想的攻城狮4 分钟前
Java 11中的Collections类详解
java·windows·python·java11·collections
前端小趴菜059 分钟前
python - input()函数
python
程序员三藏25 分钟前
Selenium+python自动化测试:解决无法启动IE浏览器及报错问题
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
瓦尔登湖50841 分钟前
DAY 40 训练和测试的规范写法
python
nju_spy1 小时前
机器学习 - Kaggle项目实践(4)Toxic Comment Classification Challenge 垃圾评论分类问题
人工智能·深度学习·自然语言处理·tf-idf·南京大学·glove词嵌入·双头gru
计算机sci论文精选1 小时前
CVPR 2025 | 具身智能 | HOLODECK:一句话召唤3D世界,智能体的“元宇宙练功房”来了
人工智能·深度学习·机器学习·计算机视觉·机器人·cvpr·具身智能
站大爷IP1 小时前
Python中None与NoneType的真相:从单例对象到类型系统的深度解析
python
秋难降1 小时前
LRU缓存算法(最近最少使用算法)——工业界缓存淘汰策略的 “默认选择”
数据结构·python·算法
站大爷IP1 小时前
Python新手踩坑实录:这些错误你可能正在犯
python