大家好,我是 Ai 学习的老章
很多论文、优质的 AI 资源都是英文的 PDF,看起来效率很低
市面上有很多 PDF 翻译产品,有些是借助大模型,我之前也有过推荐
这里再做个汇总和新项目推荐
方案 1:豆包
这算是最没有门槛的
安装豆包插件,用浏览器打开 PDF 或者直接在豆包聊天窗口上传 PDF 时,即可进行全文翻译,一定程度保留样式。

也可以把翻译后的 PDF 下载到本地
但是豆包缺点是速度很慢,页码多的话,可能会下载失败。
再有就是翻译后,样式损失不少,美观不足。

方案 2:沉浸式翻译 - PDF2HTML
这个使用就有点限制了,针对 arXiv 论文,在 arXiv 官方解析 HTML 版基础之上进行翻译

下图是一安装沉浸式翻译插件情况下,从 arXiv 官网跳转后效果

它的翻译是 100% 保留样式的,因为站在 arXiv 肩膀上了,有点占便宜
翻译后另存为 PDF 即可

方案 3:沉浸式翻译 - PDF 版
沉浸式翻译功能上有文档翻译(含 PDF)、扫描版 PDF 翻译(收费)、还有就是我要推荐的开源智能 PDF 翻译工具------BabelDOC:https://app.immersivetranslate.com/babel-doc/

优势:
- 精准排版还原:独特的版面分析技术,完整保留原文档的排版细节,包括字体、颜色、间距等
- 智能公式处理:先进公式识别技术,确保数学公式与文本的完美混排
- 专业领域优化:针对学术论文等专业文献进行特殊优化,提供更准确的翻译效果
速度也还可以:
- 50 页左右文档:通常 1-5 分钟完成
- 500 页左右文档:约 10-20 分钟完成
- 1000 页左右文档:约 10-20 分钟完成
- 5000 页左右文档:约 1-2 小时完成
当前功能还在实验阶段,单个文件不超过 500MB,不支持扫描文件(包括 OCR 版),免费用户单次 PDF 文件最多允许 166 页。
我觉得它最核心优势:开源,可基于自己的大模型 API 本地部署
项目地址:https://github.com/funstory-ai/BabelDOC


方案 4:PDF 文档翻译及双语对照工具------PDF2Zh
也是开源项目:https://github.com/PDFMathTranslate/PDFMathTranslate/
上面提到的沉浸式翻译 PDF 翻译工具 BabelDOC 应该也是基于这个项目创建的

在线体验网址:https://pdf2zh.com/

看起来是基于 Gradio 实现的,私有化部署的话调整部分功能很简单。
我试了一下,有免费额度,但很慢

鸡蛋挑骨头的话,部分涉及公式的地方,排版错乱
