GPTPDF 是一款利用视觉模型(GPT-4o)将 PDF 转为 MD 文件的开源工具
它利用 PyMuPDF 将 PDF 拆分为图片,再利用 GPT 来判断是否能够转为纯文本,否则直接使用图片,所以能够比较好的还原排版、数学公式、表格、图片、图表等。
GPTPDF 是一款利用视觉模型(GPT-4o)将 PDF 转为 MD 文件的开源工具
它利用 PyMuPDF 将 PDF 拆分为图片,再利用 GPT 来判断是否能够转为纯文本,否则直接使用图片,所以能够比较好的还原排版、数学公式、表格、图片、图表等。