Python 自动化之批量处理文件(一)

批量新建目录、文档Pro版本


文章目录


前言

我来写一个不一样的批量新建吧。在工作中,有些同学应该会遇到需要以某个excel表格为切入点,去批量的新建目录或者文档啊什么的,希望对大家有所帮助吧。


一、做成什么样子

通过读取excel文档的指定数据信息,在指定目录下、有序的、以相应的单元格的数据,进行批量新建目录、txt、docx、xlsx等。

用户需要输入的东西有:excel文档、文档里第几个sheet、从哪行那列开始、保存路径、新建数据类型(目录、txt、docx、xlsx)。

二、基本思路

1.引入库

代码如下:

python 复制代码
from openpyxl import load_workbook
from openpyxl import Workbook
from docx import Document
import os

这是后面需要用到的一些库。


2.基本架构

代码如下:

c 复制代码
.........        #用户输入

for ........:    #主循环结构
    ......       #获取excel表格里的信息

    if ......:  
        ......   #排除表格的单元格为空的情况
    else:
        .....    #生成数据类型选择

首先是输入模块,根据使用者输入的信息,为下面提供数据筛选规则。

其次是主循环结构,刚开始是先要获取excel表格里的信息。

然后if---else结构根据表格的信息:if下面的用来排除表格的单元格为空的情况。else用来生成数据类型选择(比如前面用户输入的是目录,这里就批量新建目录)

下面开始代码的编写。


三、用户输入模块

代码如下:

python 复制代码
print('请输入excel文档完整路径(例子:E:\BaiduNetdiskDownload\你好.xlsx):', end='')
excel_path = input()
# 加载工作簿(这里要加载一下,创建一个实例,后面的主循环结构里会用到)
wb = load_workbook(excel_path)

print('在文档的第几个工作表:', end='')
sheet = int(input())
# 选择工作表
ws = wb.worksheets[sheet-1]

print(f'在第{sheet}个工作表的第几列:', end='')
lie_num = int(input())

print(f'在第{sheet}个工作表的第几行开始:', end='')
hang_num = int(input())


print('打算在哪个目录下批量生成(例子:D:\dsest):', end='')
parent_directory = input()

print('打算在这个目录下批量生成什么(1 目录  2 txt  3 docx  4 xlsx ):', end='')
creat_type = input()

这里就对应了刚开头第一章节 我所提到的东西,精确定位精确匹配。

注释写的很清楚,我就不多解释了。


四、数据处理模块

1.excel表格数据获取

代码如下:

python 复制代码
i = 0    #这个是用来对批量新建的东西做排序

for row in ws.iter_rows(min_row=hang_num):   # 遍历从所选行往后的行的数据(包括所选行)
    i += 1
    value = row[lie_num-1].value        # 获取当前行所对应的列的单元格的值
    order_value = f'{i}-{value}'       #后面批量新建东西的名称就用这个,开头为数字电脑会自动排序你懂得

可能会有一些绕,多看看。简单来说就是获取用户所选范围的每个单元格的值。


2.批量数据的生成

代码如下:

python 复制代码
    if str(value) == 'None':
        pass
    else:
        if creat_type == '1':
            directory_name = str(order_value)         # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            os.makedirs(full_path, exist_ok=True)     # 创建目录,如果已经存在,则不抛出异常

            directory_name = f'{str(order_value)}.xlsx'  # 获取当前行的值并转换为字符串
            xls = Workbook()     # 新建一个 xlsx 文档     
            xls.save(full_path)  #保存

        elif creat_type == '2':
            directory_name = f'{str(order_value)}.txt'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            with open(full_path, 'a'):
                os.utime(full_path, None)  

        elif creat_type == '3':
            directory_name = f'{str(order_value)}.docx'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            doc = Document()     # 新建一个 Word 文档
            doc.save(full_path)  #保存

这段代码也是在主循环for结构的运行的,可以看出有两个if结构进行了嵌套。

最外层的if作用是:难免其中有些单元格为空,遇到了就排除了它们。

最里层的if作用是:刚开始用户选的哪个程序就执行哪个操作。同时,这里四块代码是有规律的,都是先确定了批量生成的东西的名字,然后是确定了要在哪个目录下生成,最后是生成保存。


总结

批量新建这玩意儿目前想到的就这些了,后续我想到其它新的点子再往这篇博客上编辑添加。批量删除的就暂时不写了,工作生产上应该很少删除东西,毕竟说不定哪天会用到。

相关推荐
codists10 分钟前
《Django 5 By Example》阅读笔记:p339-p358
python·django
檀越剑指大厂13 分钟前
【Python系列】异步 Web 服务器
服务器·前端·python
m0_6760995832 分钟前
数据结构--创建链表--Python
数据结构·python·链表
搬砖的果果1 小时前
HTTP代理是什么,主要用来干嘛?
网络·python·网络协议·tcp/ip·http
白初&1 小时前
文件上传代码分析
java·c++·python·php·代码审计
菜鸟小贤贤1 小时前
pyhton+yaml+pytest+allure框架封装-全局变量渲染
python·macos·pytest·接口自动化·jinja2
赛丽曼1 小时前
Python中的简单爬虫
爬虫·python
CODE_RabbitV2 小时前
Python + 深度学习从 0 到 1(00 / 99)
开发语言·python·深度学习
微凉的衣柜3 小时前
在 PyTorch 中进行推理时,为什么 `model.eval()` 和 `torch.no_grad()` 需要同时使用?
人工智能·pytorch·python
int WINGsssss3 小时前
使用系统内NCCL环境重新编译Pytorch
人工智能·pytorch·python