PDFMathTranslate - 基于AI的双语对照 PDF 翻译工具

PDFMathTranslate 是一个基于 AI 的 PDF 文档翻译工具,专门用于翻译科学论文。它能够完整保留 PDF 文档的原始排版,确保译文与原文排版一致,实现双语对照翻译,支持 Google、DeepL、Ollama 和 OpenAI 等多种翻译服务。

8800 Stars 622 Forks 21 Issues 16 贡献者 AGPL-3.0 License Python语言

代码 : https://github.com/Byaidu/PDFMathTranslate

主页 : https://pdf2zh.com/

更多AI开源软件: AI开源 - 小众AI

主要功能

  1. PDF文档翻译:

    • PDFMathTranslate支持对PDF文档进行全文翻译,用户可以选择翻译整个文档,也可以指定特定页面或章节进行部分翻译。
    • 该工具能够保留原文的排版,包括公式、图表和目录结构,确保翻译后的文档在内容和版式上与原文保持高度一致。
  2. 双语对照功能:

    • PDFMathTranslate支持生成双语对照文档,方便用户对照原文和译文,这对于需要深入理解原文内容的用户来说非常有用。
  3. 多种翻译服务支持:

    • PDFMathTranslate兼容多种翻译服务,如Google、DeepL、Ollama、OpenAI等,用户可以根据需求选择合适的翻译引擎。
    • 这为用户提供了更多的翻译选择,同时也保证了翻译的准确性和多样性。
  4. 高效的多线程翻译:

    • PDFMathTranslate使用多线程翻译技术,提高了翻译效率,使得处理大量PDF文档时更加省时省力。
  5. 正则表达式支持:

    • 用户可以使用正则表达式指定需要保留样式的字体和字符,这在处理特定格式的文档时非常有用。
  6. Web页面操作:

    • 除了命令行工具外,PDFMathTranslate还提供了Web页面操作方式,使得不习惯命令行的用户也能方便地使用该工具。
  7. 开发者扩展:

    • PDFMathTranslate提供了API接口,支持自定义开发和第三方集成,这为开发者提供了更多的可能性和扩展空间。

安装和使用

方法 I. 命令行

  1. 已安装 Python(3.8 <= 版本 <= 3.12)

  2. 安装我们的软件包:

    复制代码
    pip install pdf2zh
  3. 执行翻译,在当前工作目录中生成的文件:

    复制代码
    pdf2zh document.pdf

方法 II.便携式

无需预装 Python 环境

下载 setup.bat 并双击运行

方法 III.图形用户界面

  1. 已安装 Python(3.8 <= 版本 <= 3.12)

  2. 安装我们的软件包:

    复制代码
    pip install pdf2zh
  3. 在浏览器中开始使用:

    复制代码
    pdf2zh -i
  4. 如果您的浏览器尚未自动启动,请转到

    复制代码
    http://localhost:7860/

有关更多详细信息,请参阅 GUI 文档

方法 IV.Docker

  1. 拉取并运行:

    复制代码
    docker pull byaidu/pdf2zh
    docker run -d -p 7860:7860 byaidu/pdf2zh
  2. 在浏览器中打开:

    复制代码
    http://localhost:7860/
相关推荐
晟诺数字人5 分钟前
2026年海外直播变革:数字人如何改变游戏规则
大数据·人工智能·产品运营
蛋王派5 分钟前
DeepSeek-OCR-v2 模型解析和部署应用
人工智能·ocr
禁默10 分钟前
基于CANN的ops-cv仓库-多模态场景理解与实践
人工智能·cann
禁默19 分钟前
【硬核入门】无需板卡也能造 AI 算子?深度玩转 CANN ops-math 通用数学库
人工智能·aigc·cann
敏叔V58724 分钟前
AI智能体的工具学习进阶:零样本API理解与调用
人工智能·学习
徐小夕@趣谈前端33 分钟前
拒绝重复造轮子?我们偏偏花365天,用Vue3写了款AI协同的Word编辑器
人工智能·编辑器·word
阿里云大数据AI技术33 分钟前
全模态、多引擎、一体化,阿里云DLF3.0构建Data+AI驱动的智能湖仓平台
人工智能·阿里云·云计算
陈天伟教授34 分钟前
人工智能应用- 语言理解:05.大语言模型
人工智能·语言模型·自然语言处理
池央35 分钟前
CANN GE 深度解析:图编译器的核心优化策略、执行流调度与模型下沉技术原理
人工智能·ci/cd·自动化
七月稻草人38 分钟前
CANN ops-nn:AIGC底层神经网络算力的核心优化引擎
人工智能·神经网络·aigc·cann