Python 自动化之批量处理文件(一)

批量新建目录、文档Pro版本


文章目录


前言

我来写一个不一样的批量新建吧。在工作中,有些同学应该会遇到需要以某个excel表格为切入点,去批量的新建目录或者文档啊什么的,希望对大家有所帮助吧。


一、做成什么样子

通过读取excel文档的指定数据信息,在指定目录下、有序的、以相应的单元格的数据,进行批量新建目录、txt、docx、xlsx等。

用户需要输入的东西有:excel文档、文档里第几个sheet、从哪行那列开始、保存路径、新建数据类型(目录、txt、docx、xlsx)。

二、基本思路

1.引入库

代码如下:

python 复制代码
from openpyxl import load_workbook
from openpyxl import Workbook
from docx import Document
import os

这是后面需要用到的一些库。


2.基本架构

代码如下:

c 复制代码
.........        #用户输入

for ........:    #主循环结构
    ......       #获取excel表格里的信息

    if ......:  
        ......   #排除表格的单元格为空的情况
    else:
        .....    #生成数据类型选择

首先是输入模块,根据使用者输入的信息,为下面提供数据筛选规则。

其次是主循环结构,刚开始是先要获取excel表格里的信息。

然后if---else结构根据表格的信息:if下面的用来排除表格的单元格为空的情况。else用来生成数据类型选择(比如前面用户输入的是目录,这里就批量新建目录)

下面开始代码的编写。


三、用户输入模块

代码如下:

python 复制代码
print('请输入excel文档完整路径(例子:E:\BaiduNetdiskDownload\你好.xlsx):', end='')
excel_path = input()
# 加载工作簿(这里要加载一下,创建一个实例,后面的主循环结构里会用到)
wb = load_workbook(excel_path)

print('在文档的第几个工作表:', end='')
sheet = int(input())
# 选择工作表
ws = wb.worksheets[sheet-1]

print(f'在第{sheet}个工作表的第几列:', end='')
lie_num = int(input())

print(f'在第{sheet}个工作表的第几行开始:', end='')
hang_num = int(input())


print('打算在哪个目录下批量生成(例子:D:\dsest):', end='')
parent_directory = input()

print('打算在这个目录下批量生成什么(1 目录  2 txt  3 docx  4 xlsx ):', end='')
creat_type = input()

这里就对应了刚开头第一章节 我所提到的东西,精确定位精确匹配。

注释写的很清楚,我就不多解释了。


四、数据处理模块

1.excel表格数据获取

代码如下:

python 复制代码
i = 0    #这个是用来对批量新建的东西做排序

for row in ws.iter_rows(min_row=hang_num):   # 遍历从所选行往后的行的数据(包括所选行)
    i += 1
    value = row[lie_num-1].value        # 获取当前行所对应的列的单元格的值
    order_value = f'{i}-{value}'       #后面批量新建东西的名称就用这个,开头为数字电脑会自动排序你懂得

可能会有一些绕,多看看。简单来说就是获取用户所选范围的每个单元格的值。


2.批量数据的生成

代码如下:

python 复制代码
    if str(value) == 'None':
        pass
    else:
        if creat_type == '1':
            directory_name = str(order_value)         # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            os.makedirs(full_path, exist_ok=True)     # 创建目录,如果已经存在,则不抛出异常

            directory_name = f'{str(order_value)}.xlsx'  # 获取当前行的值并转换为字符串
            xls = Workbook()     # 新建一个 xlsx 文档     
            xls.save(full_path)  #保存

        elif creat_type == '2':
            directory_name = f'{str(order_value)}.txt'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            with open(full_path, 'a'):
                os.utime(full_path, None)  

        elif creat_type == '3':
            directory_name = f'{str(order_value)}.docx'  # 获取当前行的值并转换为字符串
            full_path = os.path.join(parent_directory, directory_name)
            doc = Document()     # 新建一个 Word 文档
            doc.save(full_path)  #保存

这段代码也是在主循环for结构的运行的,可以看出有两个if结构进行了嵌套。

最外层的if作用是:难免其中有些单元格为空,遇到了就排除了它们。

最里层的if作用是:刚开始用户选的哪个程序就执行哪个操作。同时,这里四块代码是有规律的,都是先确定了批量生成的东西的名字,然后是确定了要在哪个目录下生成,最后是生成保存。


总结

批量新建这玩意儿目前想到的就这些了,后续我想到其它新的点子再往这篇博客上编辑添加。批量删除的就暂时不写了,工作生产上应该很少删除东西,毕竟说不定哪天会用到。

相关推荐
Zzz 小生4 分钟前
编程基础学习(一)-Python基础语法+数据结构+面向对象全解析
开发语言·python
white-persist5 分钟前
JWT 漏洞全解析:从原理到实战
前端·网络·python·安全·web安全·网络安全·系统安全
久未41 分钟前
Pytorch autoload机制自动加载树外扩展(Autoload Device Extension)
人工智能·pytorch·python
java1234_小锋1 小时前
TensorFlow2 Python深度学习 - TensorFlow2框架入门 - 使用Keras.Model来定义模型
python·深度学习·tensorflow·tensorflow2
杂货铺的小掌柜1 小时前
apache poi excel 字体数量限制
java·excel·poi
codecrafter1231 小时前
FLAC3D 7.0岩土工程分析软件安装图文教程(含下载链接)
其他
Learn Beyond Limits1 小时前
TensorFlow Implementation of Content-Based Filtering|基于内容过滤的TensorFlow实现
人工智能·python·深度学习·机器学习·ai·tensorflow·吴恩达
java1234_小锋1 小时前
TensorFlow2 Python深度学习 - 函数式API(Functional API)
python·深度学习·tensorflow·tensorflow2
Y200309161 小时前
使用 PyTorch 实现 MNIST 手写数字识别
python
马尚来1 小时前
移动端自动化测试Appium,从入门到项目实战Python版
python