使用python将pdf插入到docx中

python 复制代码
from pdf2image import convert_from_path
from docx import Document
from docx.shared import Inches,Cm

# 将PDF转换为图片
pages = convert_from_path('4.pdf', 200)  # 200是DPI,可以根据需要调整

doc = Document()

# 计算图片在docx中应该显示的宽度
img_width = Cm(21-6.36-2) / 2  # 图片的宽度

# 将图片直接插入到docx文件中
for i in range(0, len(pages), 2):
    paragraph = doc.add_paragraph()  # 增加一个新的段落
    run = paragraph.add_run()
    
    for j in range(i, min(i + 2, len(pages))):
        page = pages[j]
        page.save(f'page_{j}.jpg')  # 保存图片
        run.add_picture(f'page_{j}.jpg', width=img_width)  # 直接插入图片并调整宽度

doc.save('output.docx')

效果展示:

pdf为:

docx 为:


2024-3-31 01点18分

相关推荐
断眉的派大星15 分钟前
工厂模式(Factory Pattern)完整详解
python·设计模式
好家伙VCC15 分钟前
**基于RISC-V架构的嵌入式系统开发:从零开始构建高效低功耗应用**在当前物联网(IoT)和边缘计
java·python·物联网·架构·risc-v
大佬王39 分钟前
WebSocket 连接池生产级实现:实时行情高可用与负载均衡
python·架构
ronindong1 小时前
Cursor 插件分享 | md-couture:一键将 Markdown 转换成带精美样式的 HTML
人工智能·python·ai编程
智慧地球(AI·Earth)1 小时前
规则引擎实战:Python中re库和pyknow库规则引擎实战教程
开发语言·python·程序人生
是小蟹呀^1 小时前
【总结】LangChain中的中间件Middleware
python·中间件·langchain·agent
qq_342295821 小时前
如何为容器内多个列表实现统一滚动条.txt
jvm·数据库·python
FreakStudio2 小时前
MicroPython对接大模型:uopenai + 火山方舟实现文字聊天和图片理解
python·单片机·ai·嵌入式·面向对象·电子diy
Kimliao1662 小时前
TFT-LCD液晶显示模组常见驱动电压的作用
python
qq_206901392 小时前
CSS如何引入自适应图标_利用svg外链配合css控制颜色
jvm·数据库·python