Python 自动化之批量处理文件(一)

批量新建目录、文档Pro版本


文章目录


前言

我来写一个不一样的批量新建吧。在工作中,有些同学应该会遇到需要以某个excel表格为切入点,去批量的新建目录或者文档啊什么的,希望对大家有所帮助吧。


一、做成什么样子

通过读取excel文档的指定数据信息,在指定目录下、有序的、以相应的单元格的数据,进行批量新建目录、txt、docx、xlsx等。

用户需要输入的东西有:excel文档、文档里第几个sheet、从哪行那列开始、保存路径、新建数据类型(目录、txt、docx、xlsx)。

二、基本思路

1.引入库

代码如下:

python 复制代码
from openpyxl import load_workbook
from openpyxl import Workbook
from docx import Document
import os

这是后面需要用到的一些库。


2.基本架构

代码如下:

c 复制代码
.........        #用户输入

for ........:    #主循环结构
    ......       #获取excel表格里的信息

    if ......:  
        ......   #排除表格的单元格为空的情况
    else:
        .....    #生成数据类型选择

首先是输入模块,根据使用者输入的信息,为下面提供数据筛选规则。

其次是主循环结构,刚开始是先要获取excel表格里的信息。

然后if---else结构根据表格的信息:if下面的用来排除表格的单元格为空的情况。else用来生成数据类型选择(比如前面用户输入的是目录,这里就批量新建目录)

下面开始代码的编写。


三、用户输入模块

代码如下:

python 复制代码
print('请输入excel文档完整路径(例子:E:\BaiduNetdiskDownload\你好.xlsx):', end='')
excel_path = input()
# 加载工作簿(这里要加载一下,创建一个实例,后面的主循环结构里会用到)
wb = load_workbook(excel_path)

print('在文档的第几个工作表:', end='')
sheet = int(input())
# 选择工作表
ws = wb.worksheets[sheet-1]

print(f'在第{sheet}个工作表的第几列:', end='')
lie_num = int(input())

print(f'在第{sheet}个工作表的第几行开始:', end='')
hang_num = int(input())


print('打算在哪个目录下批量生成(例子:D:\dsest):', end='')
parent_directory = input()

print('打算在这个目录下批量生成什么(1 目录  2 txt  3 docx  4 xlsx ):', end='')
creat_type = input()

这里就对应了刚开头第一章节 我所提到的东西,精确定位精确匹配。

注释写的很清楚,我就不多解释了。


四、数据处理模块

1.excel表格数据获取

代码如下:

python 复制代码
i = 0    #这个是用来对批量新建的东西做排序

for row in ws.iter_rows(min_row=hang_num):   # 遍历从所选行往后的行的数据(包括所选行)
    i += 1
    value = row[lie_num-1].value        # 获取当前行所对应的列的单元格的值
    order_value = f'{i}-{value}'       #后面批量新建东西的名称就用这个,开头为数字电脑会自动排序你懂得

可能会有一些绕,多看看。简单来说就是获取用户所选范围的每个单元格的值。


2.批量数据的生成

代码如下:

python 复制代码
    if str(value) == 'None':
        pass
    else:
        if creat_type == '1':
            directory_name = str(order_value)         # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            os.makedirs(full_path, exist_ok=True)     # 创建目录,如果已经存在,则不抛出异常

            directory_name = f'{str(order_value)}.xlsx'  # 获取当前行的值并转换为字符串
            xls = Workbook()     # 新建一个 xlsx 文档     
            xls.save(full_path)  #保存

        elif creat_type == '2':
            directory_name = f'{str(order_value)}.txt'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            with open(full_path, 'a'):
                os.utime(full_path, None)  

        elif creat_type == '3':
            directory_name = f'{str(order_value)}.docx'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            doc = Document()     # 新建一个 Word 文档
            doc.save(full_path)  #保存

这段代码也是在主循环for结构的运行的,可以看出有两个if结构进行了嵌套。

最外层的if作用是:难免其中有些单元格为空,遇到了就排除了它们。

最里层的if作用是:刚开始用户选的哪个程序就执行哪个操作。同时,这里四块代码是有规律的,都是先确定了批量生成的东西的名字,然后是确定了要在哪个目录下生成,最后是生成保存。


总结

批量新建这玩意儿目前想到的就这些了,后续我想到其它新的点子再往这篇博客上编辑添加。批量删除的就暂时不写了,工作生产上应该很少删除东西,毕竟说不定哪天会用到。

相关推荐
AIAdvocate20 分钟前
Pandas_数据结构详解
数据结构·python·pandas
小言从不摸鱼22 分钟前
【AI大模型】ChatGPT模型原理介绍(下)
人工智能·python·深度学习·机器学习·自然语言处理·chatgpt
FreakStudio2 小时前
全网最适合入门的面向对象编程教程:50 Python函数方法与接口-接口和抽象基类
python·嵌入式·面向对象·电子diy
redcocal4 小时前
地平线秋招
python·嵌入式硬件·算法·fpga开发·求职招聘
artificiali4 小时前
Anaconda配置pytorch的基本操作
人工智能·pytorch·python
RaidenQ4 小时前
2024.9.13 Python与图像处理新国大EE5731课程大作业,索贝尔算子计算边缘,高斯核模糊边缘,Haar小波计算边缘
图像处理·python·算法·课程设计
花生了什么树~.5 小时前
python基础知识(六)--字典遍历、公共运算符、公共方法、函数、变量分类、参数分类、拆包、引用
开发语言·python
Trouvaille ~5 小时前
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
图像处理·python·机器学习·numpy·信号处理·时间序列分析·科学计算
爆更小小刘5 小时前
Python基础语法(3)下
开发语言·python
哪 吒5 小时前
华为OD机试 - 第 K 个字母在原来字符串的索引(Python/JS/C/C++ 2024 E卷 100分)
javascript·python·华为od