paddleocr PP-StructureV3 pdf转md 懒人整合包 cpu可用 交互界面调整

前言

本文依旧是懒人包的优化更新

之前最大的问题就是使用fastapi这种偏向编程交互的操作方式

适合api调用,不太适合gui界面可视化操作,现在统一把fastapi改为gradio可视化交互

关于懒人包,目前最多的系列是ocr,其中pdf转md也最为常用

优化

首先第一个优化是fastapi转gradio

可以看到下图

左侧上传图片和PDF等文件,可以预览(可以拖拽和点击选择),是否批量待定

右侧查看输出的md结构,可以复制和下载

底部用于下拉和勾选对应的选项,以及点击交互,可以查看实时进度等以及一些文案提示

问题

之前把一些不必要的功能,没有验证的功能都放上去,容易让人迷惑

现在只保留PDF和PNG等转MD的功能,其他转JSON,HTML,EXCEL等功能都不做,以后如果需要和支持,再添加对应的功能

同样的对于低显存或者CPU也可以处理的AI,我会把它拆分为cpu版本和gpu版本

cpu版本用来简单体验功能和临时使用

gpu版本用来加速和大量使用

目前cpu版本先上,后续再补充gpu版本

懒人包说明

example用于放图片等示例的文件,可以快速方便的查看AI效果

models存放ai的本地模型,离线懒人包不会发起请求,只会读取本地的文件模型

output用于存放ai处理后的文件,比如处理后生成的md文件

python312为离线python环境,含有对应的依赖包

app.py为应用程序和界面,代码逻辑和界面交互都在这个文件

start.bat是win上的启动文件,方便双击一键启动

Tips

点击此处 网盘下载

目前PDF转MD系列的paddleocr PP-StructureV3效果不错,所以先更新它

后面的paddleocr vL1.5等再逐步更新

图中的启动方向分类按钮和启动去扭曲按钮只是占位

目前还没有下载对应的模型,等待后续有空再把功能补充完善

相关推荐
shuaiqinke11 小时前
【分享】Master PDF Editor v5.9.98便携版 多功能PDF编辑工具
智能手机·pdf
jianwuhuang8212 小时前
Kimi怎么导出pdf
人工智能·chatgpt·pdf·deepseek·ai导出鸭
daanpdf12 小时前
四六级翻译《中国文化概况》双语批注版pdf百度网盘
pdf
daanpdf13 小时前
古籍原文周易(易经)全文完整版PDF
pdf
daanpdf13 小时前
大学英语四级试卷历年真题及答案PDF电子版百度网盘
pdf
hikktn14 小时前
Excel模板智能转PDF:零硬编码的通用打印解决方案
windows·pdf
m0_5027249514 小时前
vue3生成pdf
前端·javascript·vue.js·pdf
驯龙高手_追风1 天前
Adobe Acrobat PDF阅读器设置默认滚动翻页
adobe·pdf·adobe acrobat reader·adobe reader
优化控制仿真模型1 天前
【26年社工】初级社会工作者历年真题及答案PDF电子版(2010-2025年)
经验分享·pdf
ComPDFKit1 天前
PDF发票生成怎么做?从零到服务化落地的完整指南
pdf·pdf生成·文件生成·发票生成