PaddleOCR-VL-1.5 PDF转MD 懒人整合包 界面微调

前言

本期依旧是把fastapi的界面改为gradio界面

原来的fastapi适合api调用,现在的gradio适合界面交互操作

本期的更新为

  • 只保留PDF转MD和图片转MD的功能,其他如json,html,excel都去掉了
  • 只保留GPU版本,无CPU版本,因为VL1.5比较占显存,CPU耗时太长

下图是两个版本对比

懒人包使用

双击start.bat

等待终端启动

启动成功后会自动打开网页

特别注意

输出的md文件在runtime文件夹下的outputs文件夹

Tips

点击此处 网盘下载

目前试了几种ocr,只有这个vl1.5 pdf转md识别率和排版都不错

其他的如小红书ocr,不解析图片,paddleocr PP-StructureV3解析正确,但是md的排版会有换行等一些细节问题

vl1.5显存占用高一点,本文测试需要8GB左右的显存

相关推荐
shuaiqinke18 小时前
【分享】Master PDF Editor v5.9.98便携版 多功能PDF编辑工具
智能手机·pdf
jianwuhuang8219 小时前
Kimi怎么导出pdf
人工智能·chatgpt·pdf·deepseek·ai导出鸭
daanpdf19 小时前
四六级翻译《中国文化概况》双语批注版pdf百度网盘
pdf
daanpdf20 小时前
古籍原文周易(易经)全文完整版PDF
pdf
daanpdf20 小时前
大学英语四级试卷历年真题及答案PDF电子版百度网盘
pdf
hikktn21 小时前
Excel模板智能转PDF:零硬编码的通用打印解决方案
windows·pdf
m0_5027249521 小时前
vue3生成pdf
前端·javascript·vue.js·pdf
驯龙高手_追风2 天前
Adobe Acrobat PDF阅读器设置默认滚动翻页
adobe·pdf·adobe acrobat reader·adobe reader
优化控制仿真模型2 天前
【26年社工】初级社会工作者历年真题及答案PDF电子版(2010-2025年)
经验分享·pdf
ComPDFKit2 天前
PDF发票生成怎么做?从零到服务化落地的完整指南
pdf·pdf生成·文件生成·发票生成