挑选出行数足够的excel文件

**

遍历文件夹下的所有excel文件,并将数据量超过指定标准的文件拷贝到指定文件夹中

python 复制代码
import os.path
import shutil
import pandas as pd


def copy_excel_files(source_folder, target_folder, row_threshold):
    if not os.path.exists(target_folder):
         os.makedirs(target_folder)

    for filename in os.listdir(source_folder):
        if filename.endswith(
                ('.xlsx', '.xls')
        ):
            file_path = os.path.join(source_folder, filename)
            try:
                df = pd.read_excel(file_path)
                if len(df) > row_threshold:
                    target_path = os.path.join(target_folder, filename)
                    shutil.copy2(file_path, target_path)
                    print(f"已复制文件{filename}")
            except Exception as e:
                print(f"处理文件{filename}时出错:{e}")

if __name__ == "__main__":
    # 源文件夹路径
    source_folder = '自定义路径1'
    # 目标文件夹路径
    target_folder = '自定义路径2'
    # 行数阈值,可根据需要修改
    row_threshold = 50

    copy_excel_files(source_folder, target_folder, row_threshold)
相关推荐
Terio_my16 分钟前
Java bean 数据校验
java·开发语言·python
Tony Bai20 分钟前
【Go开发者的数据库设计之道】07 诊断篇:SQL 性能诊断与问题排查
开发语言·数据库·后端·sql·golang
超级大只老咪42 分钟前
何为“类”?(Java基础语法)
java·开发语言·前端
我笑了OvO1 小时前
C++类和对象(1)
java·开发语言·c++·类和对象
无咎.lsy1 小时前
裸K初级篇 - (一)蜡烛突破信号
python
可触的未来,发芽的智生3 小时前
新奇特:神经网络的集团作战思维,权重共享层的智慧
人工智能·python·神经网络·算法·架构
渡我白衣3 小时前
C++ 异常处理全解析:从语法到设计哲学
开发语言·c++·面试
jerryinwuhan3 小时前
Python数据挖掘之基础分类模型_支持向量机(SVM)
python·支持向量机·数据挖掘
StarPrayers.4 小时前
基于PyTorch的CIFAR10加载与TensorBoard可视化实践
人工智能·pytorch·python·深度学习·机器学习
深蓝电商API4 小时前
实战破解前端渲染:当 Requests 无法获取数据时(Selenium/Playwright 入门)
前端·python·selenium·playwright