Python PDF转图片自定义输出

PDF转图片自定义输出

一、引入必要库

|-------------|-------------------------------|
| 1 2 | import fitz import os |

也可以检查一下版本就是了:print(fitz.__doc__)

上一篇文章已经介绍过要使用的库,和写代码要用到的思路了。我们直接开始:

二、找到文件

首先是我们要获取用户的输入:也就是说用户输入路径,我们呢只对这路径下面的文件进行处理:使用input()方法即可

|-----------|---------------------------------------|
| 1 | dir=input("请输入要处理的文件夹或者文件路径") |

当然我们可以展开让用户选择是否处理子文件夹,我这里暂且不谈。

那么我们需要判断用户输入的是一个pdf文件还是一个文件夹,这里使用介绍过的os.path.isdir()方法,当然用isfile也是一样,这里不做多余的事情就用这一个即可:

|---------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 5 6 7 8 9 10 11 | if os.path.isdir(dir): print("你选择了批处理文件夹",dir) path_list = os.listdir(dir) filelist=[] for filename in path_list: fileway=dir + "\\" + filename if os.path.isdir(dir+"\\"+filename) == False: #如果不是文件夹 filelist.append(fileway) #把文件路径加入列表 else: print("你选择了处理单个文件",dir) |

找到文件路径之后把他们加入了一个列表,接下来就是对他们的处理,这里我们选择向用户了解处理的方式和输出的方式。

|-----------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 | severtype = input("请选择处理的方式:\n1.转png\n2.转jpg\n3.仅改名\n4.更多\n") nametype = input("请选择输出的文件命名格式:\n1.原文件相同带页标\n2.生成同名文件夹page加页标\n3.仅编号\n") outway = getoutway() # 获取输出目录 |

注意这里的getoutway():

|-----------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 5 6 7 | def getoutway(): #确保路径正确 outway=input("接下来选择处理后输出的路径") if os.path.isdir(outway) == False: print("请输入正确路径") outway=getoutway() return outway |

然后我们就得到用户的想法了:这时我们需要对文件进行用户想要的操作,也就是一系列选择中找到用户需要的:

我们开始编写文件处理模块:这里默认使用单位矩阵处理pdf生成图像文件,我们可以生成更大的文件或者让用户设定dpi,这里我只实现设定缩放功能,dpi设置放在以后再完善。

相关推荐
weixin_4624462315 分钟前
【原创实践】python 获取节假日列表 并保存为excel
数据库·python·excel
计算机毕设匠心工作室25 分钟前
【python大数据毕设实战】全球大学排名数据可视化分析系统、Hadoop、计算机毕业设计、包括数据爬取、数据分析、数据可视化、机器学习、实战教学
后端·python·mysql
别叫我->学废了->lol在线等35 分钟前
演示 hasattr 和 ** 解包操作符
开发语言·前端·python
VX:Fegn08951 小时前
计算机毕业设计|基于Java人力资源管理系统(源码+数据库+文档)
java·开发语言·数据库·vue.js·spring boot·后端·课程设计
free-elcmacom1 小时前
机器学习入门<6>BP神经网络揭秘:从自行车摔跤到吃一堑长一智的AI智慧
人工智能·python·深度学习·神经网络·机器学习
Hi202402171 小时前
如何录制浏览器播放的音频?虚拟音频线与Python采集步骤
python·音视频
JIngJaneIL1 小时前
基于Java酒店预约系统(源码+数据库+文档)
java·开发语言·数据库·vue.js·spring boot
programer_332 小时前
本地手动创建一个MCP(windows环境)
windows·python·ai·mcp·cherry studio
编程小Y2 小时前
php.ini 的核心作用与全面解析
开发语言·php
曹牧2 小时前
Java:List<Map<String, String>>转换为字符串
java·开发语言·windows