PaddleOCR-VL-1.5 PDF转MD 懒人整合包 界面微调

前言

本期依旧是把fastapi的界面改为gradio界面

原来的fastapi适合api调用,现在的gradio适合界面交互操作

本期的更新为

  • 只保留PDF转MD和图片转MD的功能,其他如json,html,excel都去掉了
  • 只保留GPU版本,无CPU版本,因为VL1.5比较占显存,CPU耗时太长

下图是两个版本对比

懒人包使用

双击start.bat

等待终端启动

启动成功后会自动打开网页

特别注意

输出的md文件在runtime文件夹下的outputs文件夹

Tips

点击此处 网盘下载

目前试了几种ocr,只有这个vl1.5 pdf转md识别率和排版都不错

其他的如小红书ocr,不解析图片,paddleocr PP-StructureV3解析正确,但是md的排版会有换行等一些细节问题

vl1.5显存占用高一点,本文测试需要8GB左右的显存

相关推荐
优化控制仿真模型6 小时前
27考研数学一、二、三历年真题及答案解析PDF电子版(1987-2026年)
经验分享·pdf
huluang6 小时前
解决 Adobe Acrobat 裁剪 PDF 后内容仍存留的问题
pdf
其实秋天的枫6 小时前
27考研数学一、二、三历年真题及答案解析PDF电子版(1987-2026年)
经验分享·pdf
其实秋天的枫7 小时前
【2026专四】英语专业四级TEM4历年真题及答案电子版PDF(2009-2025年)
经验分享·pdf
SunnyDays10117 小时前
如何使用 Python 将 PDF 转换为 TIFF 或将 TIFF 转换为 PDF
人工智能·python·pdf
优化控制仿真模型8 小时前
26年新大纲普通话考试真题题库50套(PDF电子版)
经验分享·pdf
明如正午8 小时前
转换pdf文件为md文件【markitdown+pdf4llm】
python·pdf·markitdown·pdf4llm
开开心心_Every9 小时前
图片转PDF合并工具,支持扫描仪输入
运维·前端·人工智能·随机森林·edge·pdf·逻辑回归
早睡早起早日毕业9 小时前
调用MinerU的API,实现PDF转markdown文件
pdf
钱端工程师10 小时前
vue自定义一个在线查看文件的组件(.xlsx、.docx、.pdf、图片等)
javascript·vue.js·pdf