GPTPDF: 利用 GPT 将 PDF 转为 Markdown

GPTPDF 是一款利用视觉模型(GPT-4o)将 PDF 转为 MD 文件的开源工具

它利用 PyMuPDF 将 PDF 拆分为图片,再利用 GPT 来判断是否能够转为纯文本,否则直接使用图片,所以能够比较好的还原排版、数学公式、表格、图片、图表等。

相关推荐
墨香幽梦客3 分钟前
塑胶制造生产ERP:有哪些系统值得关注
大数据·人工智能·制造
说私域3 分钟前
开源AI大模型、AI智能名片与S2B2C商城系统:个体IP打造与价值赋能的新范式
人工智能·tcp/ip·开源
北京耐用通信7 分钟前
打破协议壁垒:耐达讯自动化Modbus转Profinet网关实现光伏逆变器全数据采集
运维·人工智能·物联网·网络安全·自动化·信息与通信
信息快讯19 分钟前
【机器学习在智能水泥基复合材料中的应用与实践】
人工智能·机器学习·材料工程·复合材料·水泥基复合材料
Juchecar1 小时前
如何理解“AI token 大宗商品化”?
人工智能
文火冰糖的硅基工坊1 小时前
[人工智能-大模型-29]:大模型应用层技术栈 - 第二层:Prompt 编排层(Prompt Orchestration)
人工智能·大模型·prompt·copilot
大模型真好玩1 小时前
LangGraph实战项目:从零手搓DeepResearch(三)——LangGraph多智能体搭建与部署
人工智能·langchain·mcp
飞哥数智坊1 小时前
DeepSeek-OCR:用“看图”代替“读文”,一种更像人类的上下文压缩方式
人工智能·deepseek
sunshinehine1 小时前
vue2实现pdf预览兼容低版本浏览器
pdf
L.fountain1 小时前
强化学习2.2 MDP实践——Frozen lake
人工智能·强化学习