GPTPDF: 利用 GPT 将 PDF 转为 Markdown

GPTPDF 是一款利用视觉模型(GPT-4o)将 PDF 转为 MD 文件的开源工具

它利用 PyMuPDF 将 PDF 拆分为图片,再利用 GPT 来判断是否能够转为纯文本,否则直接使用图片,所以能够比较好的还原排版、数学公式、表格、图片、图表等。

相关推荐
阿正的梦工坊4 分钟前
Sliding Window Attention(滑动窗口注意力)解析: Pytorch实现并结合全局注意力(Global Attention )
人工智能·pytorch·python
rgb2gray28 分钟前
GeoHD - 一种用于智慧城市热点探测的Python工具箱
人工智能·python·智慧城市
火车叼位39 分钟前
5个Why、SWOT, 5W2H等方法论总结,让你的提示词更加精炼
人工智能
阿正的梦工坊41 分钟前
PyTorch下三角矩阵生成函数torch.tril的深度解析
人工智能·pytorch·矩阵
说私域1 小时前
电商运营中私域流量的转化与变现:以开源AI智能名片2+1链动模式S2B2C商城小程序为例
人工智能·小程序·开源·流量运营
老A的AI实验室2 小时前
通俗理解Test time Scaling Law、RL Scaling Law和预训练Scaling Law
人工智能·深度学习·算法·chatgpt·llm·agi·rl
多云的夏天2 小时前
AI(14)-prompt
人工智能
高力士等十万人2 小时前
OpenCV对比度增强
人工智能·python·opencv
2501_907136822 小时前
Office和WPS中使用deepseek,解决出错问题,生成速度极快,一站式AI处理文档
人工智能·wps
黑尾土拨鼠2 小时前
WPS接入私有化DeepSeek大语言模型
人工智能·语言模型·wps