挑选出行数足够的excel文件

**

遍历文件夹下的所有excel文件,并将数据量超过指定标准的文件拷贝到指定文件夹中

python 复制代码
import os.path
import shutil
import pandas as pd


def copy_excel_files(source_folder, target_folder, row_threshold):
    if not os.path.exists(target_folder):
         os.makedirs(target_folder)

    for filename in os.listdir(source_folder):
        if filename.endswith(
                ('.xlsx', '.xls')
        ):
            file_path = os.path.join(source_folder, filename)
            try:
                df = pd.read_excel(file_path)
                if len(df) > row_threshold:
                    target_path = os.path.join(target_folder, filename)
                    shutil.copy2(file_path, target_path)
                    print(f"已复制文件{filename}")
            except Exception as e:
                print(f"处理文件{filename}时出错:{e}")

if __name__ == "__main__":
    # 源文件夹路径
    source_folder = '自定义路径1'
    # 目标文件夹路径
    target_folder = '自定义路径2'
    # 行数阈值,可根据需要修改
    row_threshold = 50

    copy_excel_files(source_folder, target_folder, row_threshold)
相关推荐
踏着七彩祥云的小丑5 小时前
pytest——Mark标记
开发语言·python·pytest
Dream of maid5 小时前
Python12(网络编程)
开发语言·网络·php
W23035765736 小时前
经典算法:最长上升子序列(LIS)深度解析 C++ 实现
开发语言·c++·算法
Y4090016 小时前
【多线程】线程安全(1)
java·开发语言·jvm
不爱吃炸鸡柳6 小时前
Python入门第一课:零基础认识Python + 环境搭建 + 基础语法精讲
开发语言·python
minji...7 小时前
Linux 线程同步与互斥(三) 生产者消费者模型,基于阻塞队列的生产者消费者模型的代码实现
linux·运维·服务器·开发语言·网络·c++·算法
Dxy12393102167 小时前
Python基于BERT的上下文纠错详解
开发语言·python·bert
SiYuanFeng8 小时前
Colab复现 NanoChat:从 Tokenizer(CPU)、Base Train(CPU) 到 SFT(GPU) 的完整踩坑实录
python·colab
wjs20249 小时前
JavaScript 语句
开发语言