【Python实战】-- 按条件提取所有目录下所有Excel文件指定行数据

系列文章目录

文章目录


前言

一、背景

有多个目录,每个目录下有若干Excel文件,我们要提取每个Excel里面指定的行数据:

目录如下:

注:目录数量、名称不限,其中文件数量、名称不限

二、使用步骤

1.源码

解释:

每个文件中第三列中若含有关键词"L<1.2",则将该行数据提取汇总至新表

将源码放置所汇总的目录下即可

python 复制代码
#xlwt只支持xls格式,xlsx格式需要用openpyxl或pandas
# coding:utf-8
import pandas as pd
import os 
import xlrd
import xlwt
from xlutils.copy import copy
from openpyxl import workbook
from openpyxl import load_workbook
# 读写2007 excel
import openpyxl
 

def get_allfile_msg(file_dir):
    for root, dirs, files in os.walk(file_dir):
        return root, dirs, [file for file in files if file.endswith('.xls') or file.endswith('.xlsx')]

def get_allfile_url(root, files):
    allFile_url = []
    for file_name in files:
        file_url = root + "/" + file_name
        allFile_url.append(file_url)
    return allFile_url

def get_file_name(path, suffix = ['.xlsx', '.xls']):
    tmp_lst = []
    for root,dirs,files in os.walk(path):
        for file in files:
            tmp_lst.append(os.path.join(root, file))
    return tmp_lst

 
if __name__ == '__main__':
    file_dir = os.getcwd()
    root, dirs, files = get_allfile_msg(file_dir)
    allFile_url = get_allfile_url(root, files)
    print(root)
    print(dirs)
    number = len(dirs)
    print(number)
    n = 0
    #**********************************************************
    jieguo = xlwt.Workbook(encoding="ascii")  #生成excel
    wsheet = jieguo.add_sheet('sheet name') #生成sheet    
    y=0 #生成的excel的行计数
    keyword = 'L<1.2'
    #**********************************************************
    for n in range(len(dirs)):
        dir = dirs[n]
        path = root + '\\' + dir
        print(path) 
        tmp_lst = get_file_name(path)
        print(tmp_lst)
        #main()
        #'''
        try:
            for xl in tmp_lst:
                workbook = xlrd.open_workbook(xl) #读取源excel文件
                print(xl)
                sheetnum=workbook.nsheets  #获取源文件sheet数目
                print(sheetnum)
                #for m in range(0,sheetnum):
                sheet = workbook.sheet_by_index(0) #读取源excel文件第m个sheet的内容
                nrowsnum=sheet.nrows  #获取该sheet的行数
                for i in range(0,nrowsnum):
                    if str(sheet.cell(i,2).value) == keyword:
                        u = i
                        date = sheet.row(u)
                        y = y + 1
                        for j in range(len(date)):
                            wsheet.write(y,j,sheet.cell_value(i,j))
        #jieguo.save('jieguo.xls') #保存新生成的Excel
        except Exception as e:
            print(e)                        
        #jieguo.save('jieguo.xls') #保存新生成的Excel        
        #'''
        n =  n + 1
        y = y + 1
        jieguo.save('jieguo.xls') #保存新生成的Excel   

总结

分享:

在极端痛苦中,一个灵魂为了承受这份痛苦,将会发出崭新的生命光辉。就是这股潜力在新生命里的发挥,使人们远离在极端痛苦时燃起的自杀念头,让他得以继续活下去。他的心境将别于健康的人,他鄙视世人所认同的价值观,从而发挥昔日所未曾有过的最高贵的爱与情操,这种心境是曾体验过地狱烈火般痛苦的人所独有的。------尼采《曙光》

相关推荐
CSDN_Colinw1 分钟前
Python GUI开发:Tkinter入门教程
jvm·数据库·python
沉沙丶6 分钟前
关于matlab分析电流THD的一些探究和记录
开发语言·matlab·电机控制·foc·永磁同步电机·模型预测·预测控制
chase。8 分钟前
Python包构建工具完全指南:python -m build 使用详解
开发语言·chrome·python
SuperEugene12 分钟前
前端 utils 工具函数规范:拆分 / 命名 / 复用全指南,避开全局污染等高频坑|编码语法规范篇
开发语言·前端·javascript
xin_yao_xin12 分钟前
PaddleOCR系列——《文本检测、文本识别》模型训练
人工智能·python·paddlepaddle·ppocr
2401_8331977312 分钟前
用Python制作一个文字冒险游戏
jvm·数据库·python
古城小栈20 分钟前
Go 底层代码的完整分类
开发语言·后端·golang
耳冉鹅25 分钟前
Go无锁共享内存环形缓冲区设计
开发语言·golang
万粉变现经纪人30 分钟前
如何解决 pip install cx_Oracle 报错 未找到 Oracle Instant Client 问题
数据库·python·mysql·oracle·pycharm·bug·pip
sw12138930 分钟前
使用Plotly创建交互式图表
jvm·数据库·python