使用python将pdf插入到docx中

python 复制代码
from pdf2image import convert_from_path
from docx import Document
from docx.shared import Inches,Cm

# 将PDF转换为图片
pages = convert_from_path('4.pdf', 200)  # 200是DPI,可以根据需要调整

doc = Document()

# 计算图片在docx中应该显示的宽度
img_width = Cm(21-6.36-2) / 2  # 图片的宽度

# 将图片直接插入到docx文件中
for i in range(0, len(pages), 2):
    paragraph = doc.add_paragraph()  # 增加一个新的段落
    run = paragraph.add_run()
    
    for j in range(i, min(i + 2, len(pages))):
        page = pages[j]
        page.save(f'page_{j}.jpg')  # 保存图片
        run.add_picture(f'page_{j}.jpg', width=img_width)  # 直接插入图片并调整宽度

doc.save('output.docx')

效果展示:

pdf为:

docx 为:


2024-3-31 01点18分

相关推荐
二川bro2 小时前
量子计算入门:Python量子编程基础
python
夏天的味道٥3 小时前
@JsonIgnore对Date类型不生效
开发语言·python
tsumikistep3 小时前
【前后端】接口文档与导入
前端·后端·python·硬件架构
小白学大数据3 小时前
Python爬虫伪装策略:如何模拟浏览器正常访问JSP站点
java·开发语言·爬虫·python
头发还在的女程序员5 小时前
三天搞定招聘系统!附完整源码
开发语言·python
温轻舟5 小时前
Python自动办公工具06-设置Word文档中表格的格式
开发语言·python·word·自动化工具·温轻舟
花酒锄作田5 小时前
[python]FastAPI-Tracking ID 的设计
python·fastapi
AI-智能5 小时前
别啃文档了!3 分钟带小白跑完 Dify 全链路:从 0 到第一个 AI 工作流
人工智能·python·自然语言处理·llm·embedding·agent·rag
d***95626 小时前
爬虫自动化(DrissionPage)
爬虫·python·自动化
APIshop7 小时前
Python 零基础写爬虫:一步步抓取商品详情(超细详解)
开发语言·爬虫·python