GPTPDF: 利用 GPT 将 PDF 转为 Markdown

GPTPDF 是一款利用视觉模型(GPT-4o)将 PDF 转为 MD 文件的开源工具

它利用 PyMuPDF 将 PDF 拆分为图片,再利用 GPT 来判断是否能够转为纯文本,否则直接使用图片,所以能够比较好的还原排版、数学公式、表格、图片、图表等。

相关推荐
真想骂*34 分钟前
人工智能如何重塑音频、视觉及多模态领域的应用格局
人工智能·音视频
赛丽曼3 小时前
机器学习-K近邻算法
人工智能·机器学习·近邻算法
啊波次得饿佛哥4 小时前
7. 计算机视觉
人工智能·计算机视觉·视觉检测
XianxinMao5 小时前
RLHF技术应用探析:从安全任务到高阶能力提升
人工智能·python·算法
Swift社区5 小时前
【分布式日志篇】从工具选型到实战部署:全面解析日志采集与管理路径
人工智能·spring boot·分布式
Quz5 小时前
OpenCV:高通滤波之索贝尔、沙尔和拉普拉斯
图像处理·人工智能·opencv·计算机视觉·矩阵
去往火星5 小时前
OpenCV文字绘制支持中文显示
人工智能·opencv·计算机视觉
海里的鱼20226 小时前
yolov11配置环境,实现OBB带方向目标检测
人工智能·yolo·目标检测·计算机视觉
道友老李6 小时前
【自然语言处理(NLP)】介绍、发展史
人工智能·自然语言处理
有Li7 小时前
基于深度学习的微出血自动检测及解剖尺度定位|文献速递-视觉大模型医疗图像应用
人工智能·深度学习