PDFMathTranslate - 基于AI的双语对照 PDF 翻译工具

PDFMathTranslate 是一个基于 AI 的 PDF 文档翻译工具,专门用于翻译科学论文。它能够完整保留 PDF 文档的原始排版,确保译文与原文排版一致,实现双语对照翻译,支持 Google、DeepL、Ollama 和 OpenAI 等多种翻译服务。

8800 Stars 622 Forks 21 Issues 16 贡献者 AGPL-3.0 License Python语言

代码 : https://github.com/Byaidu/PDFMathTranslate

主页 : https://pdf2zh.com/

更多AI开源软件: AI开源 - 小众AI

主要功能

  1. PDF文档翻译:

    • PDFMathTranslate支持对PDF文档进行全文翻译,用户可以选择翻译整个文档,也可以指定特定页面或章节进行部分翻译。
    • 该工具能够保留原文的排版,包括公式、图表和目录结构,确保翻译后的文档在内容和版式上与原文保持高度一致。
  2. 双语对照功能:

    • PDFMathTranslate支持生成双语对照文档,方便用户对照原文和译文,这对于需要深入理解原文内容的用户来说非常有用。
  3. 多种翻译服务支持:

    • PDFMathTranslate兼容多种翻译服务,如Google、DeepL、Ollama、OpenAI等,用户可以根据需求选择合适的翻译引擎。
    • 这为用户提供了更多的翻译选择,同时也保证了翻译的准确性和多样性。
  4. 高效的多线程翻译:

    • PDFMathTranslate使用多线程翻译技术,提高了翻译效率,使得处理大量PDF文档时更加省时省力。
  5. 正则表达式支持:

    • 用户可以使用正则表达式指定需要保留样式的字体和字符,这在处理特定格式的文档时非常有用。
  6. Web页面操作:

    • 除了命令行工具外,PDFMathTranslate还提供了Web页面操作方式,使得不习惯命令行的用户也能方便地使用该工具。
  7. 开发者扩展:

    • PDFMathTranslate提供了API接口,支持自定义开发和第三方集成,这为开发者提供了更多的可能性和扩展空间。

安装和使用

方法 I. 命令行

  1. 已安装 Python(3.8 <= 版本 <= 3.12)

  2. 安装我们的软件包:

    pip install pdf2zh
    
  3. 执行翻译,在当前工作目录中生成的文件:

    pdf2zh document.pdf
    

方法 II.便携式

无需预装 Python 环境

下载 setup.bat 并双击运行

方法 III.图形用户界面

  1. 已安装 Python(3.8 <= 版本 <= 3.12)

  2. 安装我们的软件包:

    pip install pdf2zh
    
  3. 在浏览器中开始使用:

    pdf2zh -i
    
  4. 如果您的浏览器尚未自动启动,请转到

    http://localhost:7860/
    

有关更多详细信息,请参阅 GUI 文档

方法 IV.Docker

  1. 拉取并运行:

    docker pull byaidu/pdf2zh
    docker run -d -p 7860:7860 byaidu/pdf2zh
    
  2. 在浏览器中打开:

    http://localhost:7860/
    
相关推荐
云起无垠27 分钟前
【论文速读】| FirmRCA:面向 ARM 嵌入式固件的后模糊测试分析,并实现高效的基于事件的故障定位
人工智能·自动化
Leweslyh3 小时前
物理信息神经网络(PINN)八课时教案
人工智能·深度学习·神经网络·物理信息神经网络
love you joyfully3 小时前
目标检测与R-CNN——pytorch与paddle实现目标检测与R-CNN
人工智能·pytorch·目标检测·cnn·paddle
该醒醒了~3 小时前
PaddlePaddle推理模型利用Paddle2ONNX转换成onnx模型
人工智能·paddlepaddle
小树苗1933 小时前
DePIN潜力项目Spheron解读:激活闲置硬件,赋能Web3与AI
人工智能·web3
凡人的AI工具箱3 小时前
每天40分玩转Django:Django测试
数据库·人工智能·后端·python·django·sqlite
大多_C3 小时前
BERT outputs
人工智能·深度学习·bert
Debroon4 小时前
乳腺癌多模态诊断解释框架:CNN + 可解释 AI 可视化
人工智能·神经网络·cnn
反方向的钟儿4 小时前
非结构化数据分析与应用(Unstructured data analysis and applications)(pt3)图像数据分析1
人工智能·计算机视觉·数据分析
Heartsuit4 小时前
LLM大语言模型私有化部署-使用Dify的工作流编排打造专属AI搜索引擎
人工智能·dify·ollama·qwen2.5·ai搜索引擎·tavily search·工作流编排