PDFMathTranslate - 基于AI的双语对照 PDF 翻译工具

PDFMathTranslate 是一个基于 AI 的 PDF 文档翻译工具,专门用于翻译科学论文。它能够完整保留 PDF 文档的原始排版,确保译文与原文排版一致,实现双语对照翻译,支持 Google、DeepL、Ollama 和 OpenAI 等多种翻译服务。

8800 Stars 622 Forks 21 Issues 16 贡献者 AGPL-3.0 License Python语言

代码 : https://github.com/Byaidu/PDFMathTranslate

主页 : https://pdf2zh.com/

更多AI开源软件: AI开源 - 小众AI

主要功能

  1. PDF文档翻译:

    • PDFMathTranslate支持对PDF文档进行全文翻译,用户可以选择翻译整个文档,也可以指定特定页面或章节进行部分翻译。
    • 该工具能够保留原文的排版,包括公式、图表和目录结构,确保翻译后的文档在内容和版式上与原文保持高度一致。
  2. 双语对照功能:

    • PDFMathTranslate支持生成双语对照文档,方便用户对照原文和译文,这对于需要深入理解原文内容的用户来说非常有用。
  3. 多种翻译服务支持:

    • PDFMathTranslate兼容多种翻译服务,如Google、DeepL、Ollama、OpenAI等,用户可以根据需求选择合适的翻译引擎。
    • 这为用户提供了更多的翻译选择,同时也保证了翻译的准确性和多样性。
  4. 高效的多线程翻译:

    • PDFMathTranslate使用多线程翻译技术,提高了翻译效率,使得处理大量PDF文档时更加省时省力。
  5. 正则表达式支持:

    • 用户可以使用正则表达式指定需要保留样式的字体和字符,这在处理特定格式的文档时非常有用。
  6. Web页面操作:

    • 除了命令行工具外,PDFMathTranslate还提供了Web页面操作方式,使得不习惯命令行的用户也能方便地使用该工具。
  7. 开发者扩展:

    • PDFMathTranslate提供了API接口,支持自定义开发和第三方集成,这为开发者提供了更多的可能性和扩展空间。

安装和使用

方法 I. 命令行

  1. 已安装 Python(3.8 <= 版本 <= 3.12)

  2. 安装我们的软件包:

    复制代码
    pip install pdf2zh
  3. 执行翻译,在当前工作目录中生成的文件:

    复制代码
    pdf2zh document.pdf

方法 II.便携式

无需预装 Python 环境

下载 setup.bat 并双击运行

方法 III.图形用户界面

  1. 已安装 Python(3.8 <= 版本 <= 3.12)

  2. 安装我们的软件包:

    复制代码
    pip install pdf2zh
  3. 在浏览器中开始使用:

    复制代码
    pdf2zh -i
  4. 如果您的浏览器尚未自动启动,请转到

    复制代码
    http://localhost:7860/

有关更多详细信息,请参阅 GUI 文档

方法 IV.Docker

  1. 拉取并运行:

    复制代码
    docker pull byaidu/pdf2zh
    docker run -d -p 7860:7860 byaidu/pdf2zh
  2. 在浏览器中打开:

    复制代码
    http://localhost:7860/
相关推荐
一个处女座的程序猿1 分钟前
LLMs之SLMs:《Small Language Models are the Future of Agentic AI》的翻译与解读
人工智能·自然语言处理·小语言模型·slms
档案宝档案管理3 小时前
档案宝:企业合同档案管理的“安全保险箱”与“效率加速器”
大数据·数据库·人工智能·安全·档案·档案管理
IT_Beijing_BIT4 小时前
TensorFlow Keras
人工智能·tensorflow·keras
mit6.8244 小时前
[手机AI开发sdk] 安卓上的Linux环境
人工智能·智能手机
AI炼金师4 小时前
Claude Code Web:它是什么以及如何使用
ai编程·极限编程·vibecoding
张较瘦_4 小时前
[论文阅读] AI + 教育 | AI赋能“三个课堂”的破局之道——具身认知与技术路径深度解读
论文阅读·人工智能
小雨青年5 小时前
Cursor 项目实战:AI播客策划助手(二)—— 多轮交互打磨播客文案的技术实现与实践
前端·人工智能·状态模式·交互
西西弗Sisyphus5 小时前
线性代数 - 初等矩阵
人工智能·线性代数·机器学习
王哈哈^_^5 小时前
【数据集】【YOLO】【目标检测】共享单车数据集,共享单车识别数据集 3596 张,YOLO自行车识别算法实战训推教程。
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
仙人掌_lz5 小时前
Multi-Agent的编排模式总结/ Parlant和LangGraph差异对比
人工智能·ai·llm·原型模式·rag·智能体