分享一个非常实用的PDF文档翻译项目------PDFMathTranslate。作为一个经常逛GitHub的开发者,我总喜欢翻看各种项目附带的论文,虽然大多时候是瞎研究,但却乐在其中。该项目能够完美保留公式、图表、目录和注释,对于需要阅读外文文献的同学来说绝对是一个利器!(外语好的当我没说哈!)

先来看看效果,这是我用GitHub - memoavatar/memo: Memory-Guided Diffusion for Expressive Talking Video Generation该项目的论文进行翻译的结果。
论文链接https://arxiv.org/abs/2412.04448


效果非常不错,当然你不仅可以用它翻译论文,任何PDF内容都支持。
只支持PDF,如果是word等其他格式的,需要转成PDF格式来进行处理
本地部署
如果想在本地部署开发,有以下几种方式,要用整合包,可以跳过这部分。
-
命令行方式:
pip install pdf2zh
pdf2zh document.pdf -
图形界面方式:
pip install pdf2zh
pdf2zh -i
然后在浏览器打开 http://localhost:7860 即可使用。
-
Docker部署:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
🔧 进阶功能:
-
部分翻译:如果只需要翻译特定页面,可以使用 -p 参数
pdf2zh example.pdf -p 1-3,5
-
自定义语言:支持指定源语言和目标语言
pdf2zh example.pdf -li en -lo ja
-
选择翻译服务:可以根据需求切换不同的翻译服务
pdf2zh example.pdf -s openai:gpt-4
快速上手
最简单的使用方式是访问官方提供的在线服务:PDFMathTranslate - PDF Translation with preserved formats
无需安装任何东西,直接上传PDF即可获得翻译结果。
需要注意的是在线服务考虑到服务器压力,上传的PDF文件大小不能超过5M。如果要翻译大于5M的,咱们建议还是用整合包或者本地部署。
简单说下使用方法,没什么难度。

类型
类型这里有两种选择,一种是直接上传本地的PDF文件。

一种是直接复制链接进去。
例如:https://arxiv.org/pdf/2412.04448

翻译服务
这里选择对应的翻译服务

需要注意的是某些翻译服务需要用到API,需要到对应的平台上去申请。
翻译语言设置
这个也不用过多介绍

可以看到支持的语言列表

页面范围
翻译的范围。对于大型PDF文档,建议先试译几页看看效果

批量处理
在使用的时候,考虑到有时候不是一个文档需要翻译,但是每次都要设置,然后来回点击也挺麻烦的。
于是我动动手,加了批量功能。

可以添加多个PDF进行处理。
处理好的文件点击打开默认输出文件夹
即可找到

一个pdf会生成三个文件。

2412.04448v1
原文件。
2412.04448v1-zh
翻译后的文件。
2412.04448v1-dual
翻译后的双语文件。
需要注意
💡翻译服务中例如谷歌、必应、DeepL、Azure等国外服务需开启对应的网络环境。
配置要求
WIN
WindowsN卡需2G显存
如果整合包运行报错,需要安装cuda12.4或cuda11.8
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC
MAC Apple Silicon M1/M2/M3/M4 芯片
2G内存
整合包获取
👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻
https://pan.quark.cn/s/a34b907537f0
https://pan.baidu.com/s/1Q8F3dFg1XUxCOD_O_QuuoQ?pwd=bzzv
如果发了关键词没回复你!记得看下复制的时候是不是把空格给粘贴进去了!
制作不易,如果本文对您有帮助,还请点个免费的赞或在看!感谢您的阅读!