为了将每个Excel文件的数据量统一减少至120000行,可以使用Python的
pandas
库来加载、修改和保存每个文件。以下是一个简单的Python脚本:
首先,确保已经安装了pandas
库,如果没有安装,可以通过以下命令安装:
py
pip install pandas
接下来是处理数据的代码:
python
import os
import pandas as pd
def trim_excel_files(root_dir, max_rows=120000-1):
# 遍历根目录下的所有子目录
for condition_dir in os.listdir(root_dir):
condition_path = os.path.join(root_dir, condition_dir)
if os.path.isdir(condition_path):
# 遍历每个工况目录下的所有Excel文件
for file in os.listdir(condition_path):
if file.endswith('.xlsx'):
file_path = os.path.join(condition_path, file)
# 读取Excel文件
df = pd.read_excel(file_path)
# 如果行数超过120000,进行缩减
if len(df) > max_rows:
df = df.iloc[:max_rows]
# 保存修改后的数据到原文件
df.to_excel(file_path, index=False)
print(f"Processed {file_path}")
# 指定数据所在的根目录
root_dir = './程序代码1/data'
trim_excel_files(root_dir)
这个脚本首先定义了一个trim_excel_files
函数,它接收一个包含数据文件的根目录作为参数。该函数将遍历根目录下的所有子目录,读取每个.xlsx
文件,检查其中的行数,如果超过120000行,则将其缩减至120000行,并将修改后的数据保存回原文件。这个过程会替换掉原有的文件,请确保有备份或是可以接受这种替换。