使用python将pdf插入到docx中

python 复制代码
from pdf2image import convert_from_path
from docx import Document
from docx.shared import Inches,Cm

# 将PDF转换为图片
pages = convert_from_path('4.pdf', 200)  # 200是DPI,可以根据需要调整

doc = Document()

# 计算图片在docx中应该显示的宽度
img_width = Cm(21-6.36-2) / 2  # 图片的宽度

# 将图片直接插入到docx文件中
for i in range(0, len(pages), 2):
    paragraph = doc.add_paragraph()  # 增加一个新的段落
    run = paragraph.add_run()
    
    for j in range(i, min(i + 2, len(pages))):
        page = pages[j]
        page.save(f'page_{j}.jpg')  # 保存图片
        run.add_picture(f'page_{j}.jpg', width=img_width)  # 直接插入图片并调整宽度

doc.save('output.docx')

效果展示:

pdf为:

docx 为:


2024-3-31 01点18分

相关推荐
一个天蝎座 白勺 程序猿41 分钟前
Python爬虫(8)Python数据存储实战:JSON文件读写与复杂结构化数据处理指南
爬虫·python·json
q_q王1 小时前
dify对接飞书云文档,并且将图片传入飞书文档
python·大模型·飞书·dify·智能体·图片展示
noravinsc1 小时前
django filter 排除字段
后端·python·django
zandy10112 小时前
嵌入式BI开发指南:如何通过衡石API将分析能力集成到业务系统?
开发语言·python·嵌入式
曲幽2 小时前
零基础快速搭建AI绘画网站!用Gradio玩转Stable Diffusion
python·ai作画·stable diffusion·gradio·diffusers·webui
2401_890665862 小时前
免费送源码:Java+ssm+HTML 三分糖——甜品店网站设计与实现 计算机毕业设计原创定制
java·python·微信小程序·html·php·课程设计·android-studio
noravinsc2 小时前
django filter 日期大于当前日期的
python·django
悲喜自渡7212 小时前
pytorch & python常用指令
人工智能·pytorch·python
Star abuse3 小时前
Python爬虫课程实验指导书
开发语言·爬虫·python
秋名RG3 小时前
简单了解Java的I/O流机制与文件读写操作
java·开发语言·python