PaddleOCR-VL-1.5 PDF转MD 懒人整合包 界面微调

前言

本期依旧是把fastapi的界面改为gradio界面

原来的fastapi适合api调用,现在的gradio适合界面交互操作

本期的更新为

  • 只保留PDF转MD和图片转MD的功能,其他如json,html,excel都去掉了
  • 只保留GPU版本,无CPU版本,因为VL1.5比较占显存,CPU耗时太长

下图是两个版本对比

懒人包使用

双击start.bat

等待终端启动

启动成功后会自动打开网页

特别注意

输出的md文件在runtime文件夹下的outputs文件夹

Tips

点击此处 网盘下载

目前试了几种ocr,只有这个vl1.5 pdf转md识别率和排版都不错

其他的如小红书ocr,不解析图片,paddleocr PP-StructureV3解析正确,但是md的排版会有换行等一些细节问题

vl1.5显存占用高一点,本文测试需要8GB左右的显存

相关推荐
weixin_397574099 小时前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf
Metaphor69210 小时前
使用 Python 将 PDF 转换为 HTML
python·pdf·html
2601_9618451510 小时前
粉笔行测5000题电子版|pdf|解析
pdf·新媒体运营·github·个人开发·内容运营·规格说明书·极限编程
Sour11 小时前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端·pdf·ocr
狂奔solar15 小时前
OpenDataLoader-PDF 做 PDF 解析可视化调试器
pdf·rag 预处理
chatexcel15 小时前
ChatExcel Max使用教程:图片、PDF、网页与复杂Excel的一站式数据分析
数据分析·pdf·excel
绘梨衣54716 小时前
PDF表格解析知识总结
开发语言·python·pdf
qq_5469372716 小时前
Excel批量转PDF_Word_图片,支持自动合并报表,效率翻倍。
pdf·word·excel
zyplayer-doc1 天前
企业知识库安全与权限管理完全指南:从加密到审计的六层防护
人工智能·安全·pdf·编辑器·创业创新
易鹤鹤.1 天前
pdf标注高亮
pdf