Python 自动化之批量处理文件（一）

批量新建目录、文档Pro版本

文章目录

批量新建目录、文档Pro版本
前言
一、做成什么样子
二、基本思路
- 1.引入库
- 2.基本架构
三、用户输入模块
四、数据处理模块
- 1.excel表格数据获取
- 2.批量数据的生成
总结

前言

我来写一个不一样的批量新建吧。在工作中，有些同学应该会遇到需要以某个excel表格为切入点，去批量的新建目录或者文档啊什么的，希望对大家有所帮助吧。

一、做成什么样子

通过读取excel文档的指定数据信息，在指定目录下、有序的、以相应的单元格的数据，进行批量新建目录、txt、docx、xlsx等。

用户需要输入的东西有：excel文档、文档里第几个sheet、从哪行那列开始、保存路径、新建数据类型（目录、txt、docx、xlsx）。

二、基本思路

1.引入库

代码如下：

python 复制代码

from openpyxl import load_workbook
from openpyxl import Workbook
from docx import Document
import os

这是后面需要用到的一些库。

2.基本架构

代码如下：

c 复制代码

.........        #用户输入

for ........:    #主循环结构
    ......       #获取excel表格里的信息

    if ......:  
        ......   #排除表格的单元格为空的情况
    else:
        .....    #生成数据类型选择

首先是输入模块，根据使用者输入的信息，为下面提供数据筛选规则。

其次是主循环结构，刚开始是先要获取excel表格里的信息。

然后if---else结构根据表格的信息：if下面的用来排除表格的单元格为空的情况。else用来生成数据类型选择（比如前面用户输入的是目录，这里就批量新建目录）

下面开始代码的编写。

三、用户输入模块

代码如下：

python 复制代码

print('请输入excel文档完整路径（例子：E:\BaiduNetdiskDownload\你好.xlsx）：', end='')
excel_path = input()
# 加载工作簿（这里要加载一下，创建一个实例，后面的主循环结构里会用到）
wb = load_workbook(excel_path)

print('在文档的第几个工作表：', end='')
sheet = int(input())
# 选择工作表
ws = wb.worksheets[sheet-1]

print(f'在第{sheet}个工作表的第几列：', end='')
lie_num = int(input())

print(f'在第{sheet}个工作表的第几行开始：', end='')
hang_num = int(input())


print('打算在哪个目录下批量生成（例子：D:\dsest）：', end='')
parent_directory = input()

print('打算在这个目录下批量生成什么（1 目录  2 txt  3 docx  4 xlsx ）：', end='')
creat_type = input()

这里就对应了刚开头第一章节 我所提到的东西，精确定位精确匹配。

注释写的很清楚，我就不多解释了。

四、数据处理模块

1.excel表格数据获取

代码如下：

python 复制代码

i = 0    #这个是用来对批量新建的东西做排序

for row in ws.iter_rows(min_row=hang_num):   # 遍历从所选行往后的行的数据（包括所选行）
    i += 1
    value = row[lie_num-1].value        # 获取当前行所对应的列的单元格的值
    order_value = f'{i}-{value}'       #后面批量新建东西的名称就用这个，开头为数字电脑会自动排序你懂得

可能会有一些绕，多看看。简单来说就是获取用户所选范围的每个单元格的值。

2.批量数据的生成

代码如下：

python 复制代码

    if str(value) == 'None':
        pass
    else:
        if creat_type == '1':
            directory_name = str(order_value)         # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            os.makedirs(full_path, exist_ok=True)     # 创建目录，如果已经存在，则不抛出异常

            directory_name = f'{str(order_value)}.xlsx'  # 获取当前行的值并转换为字符串
            xls = Workbook()     # 新建一个 xlsx 文档     
            xls.save(full_path)  #保存

        elif creat_type == '2':
            directory_name = f'{str(order_value)}.txt'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            with open(full_path, 'a'):
                os.utime(full_path, None)  

        elif creat_type == '3':
            directory_name = f'{str(order_value)}.docx'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            doc = Document()     # 新建一个 Word 文档
            doc.save(full_path)  #保存

这段代码也是在主循环for结构的运行的，可以看出有两个if结构进行了嵌套。

最外层的if作用是：难免其中有些单元格为空，遇到了就排除了它们。

最里层的if作用是：刚开始用户选的哪个程序就执行哪个操作。同时，这里四块代码是有规律的，都是先确定了批量生成的东西的名字，然后是确定了要在哪个目录下生成，最后是生成保存。

总结

批量新建这玩意儿目前想到的就这些了，后续我想到其它新的点子再往这篇博客上编辑添加。批量删除的就暂时不写了，工作生产上应该很少删除东西，毕竟说不定哪天会用到。