PaddleOCR-VL-1.5 PDF转MD 懒人整合包 界面微调

前言

本期依旧是把fastapi的界面改为gradio界面

原来的fastapi适合api调用,现在的gradio适合界面交互操作

本期的更新为

  • 只保留PDF转MD和图片转MD的功能,其他如json,html,excel都去掉了
  • 只保留GPU版本,无CPU版本,因为VL1.5比较占显存,CPU耗时太长

下图是两个版本对比

懒人包使用

双击start.bat

等待终端启动

启动成功后会自动打开网页

特别注意

输出的md文件在runtime文件夹下的outputs文件夹

Tips

点击此处 网盘下载

目前试了几种ocr,只有这个vl1.5 pdf转md识别率和排版都不错

其他的如小红书ocr,不解析图片,paddleocr PP-StructureV3解析正确,但是md的排版会有换行等一些细节问题

vl1.5显存占用高一点,本文测试需要8GB左右的显存

相关推荐
Miss 古月先生4 小时前
thinkphp6.0 html生成pdf
后端·pdf·php
胡单纯4 小时前
AI 直接解析 PDF 文档!OpenClaw 2026.3.3 新功能实测太强了
数据库·人工智能·pdf
开开心心就好4 小时前
操作简单的ISO文件编辑转换工具
java·前端·科技·edge·pdf·安全威胁分析·ddos
私人珍藏库16 小时前
【Windows】PDF超能助手(1.0.13)
windows·pdf·工具·软件·多功能
其实秋天的枫18 小时前
2026年新大纲普通话考试真题题库50套(PDF电子版)
经验分享·pdf
开开心心_Every20 小时前
文字转语音无字数限,对接微软接口比付费爽
运维·服务器·人工智能·edge·pdf·paddle·segmentfault
无心水20 小时前
2、5分钟上手|PyPDF2 快速提取PDF文本
java·linux·分布式·后端·python·架构·pdf
优化控制仿真模型21 小时前
2026年新大纲普通话考试真题题库50套(PDF电子版)
经验分享·pdf
SEO-狼术1 天前
Aspose.PDF for .NET 24.5 Crack
pdf