PDFMathTranslate 安装、使用及接入deepseek

PDFMathTranslate 安装、使用及接入deepseek

介绍

PDFMathTranslate 是非常好用的科学 PDF 文档翻译及双语对照工具,可以将论文按照其原本的排版结构执行多种语言翻译,并且可以接入如:谷歌翻译、deepl、deepseek、chatgpt 等工具,是十分高效的翻译工具,项目的github网址为:PDFMathTranslate

我就是在看其他人的帖子的时候看到了这个翻译工具,但是当我使用时候发现需要自己设置一下翻译服务才能使用如谷歌翻译、deepseek等服务,但是我看了一下网上,基本上很多教程讲述如何安装使用,但是没有介绍如何配置服务(也有可能是我没找到)然后我摸索了一下,找到了配置文件的位置,然后就想简单写一个记录,期望可以帮助到他人。

安装及使用

PDFMathTranslate 项目在介绍文件中提供了多种的安装和使用方法,可以直接按照方法安装即可。

例如:

  1. 使用Windows exe需要下载指定的压缩包:pdf2zh-v1.9.6-win64.zip,解压后运行pdf2zh.exe ("\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh.exe")即可打开本地网页上传文件翻译。
  2. 使用python图形用户界面,可以直接使用 pip 安装指定的包,然后执行指定命令即可打开图形化界面。
bash 复制代码
pip install pdf2zh

执行 pdf2zh -i 即可打开图形界面

bash 复制代码
pdf2zh -i

接入deepseek

PDFMathTranslate支持接入多种翻译服务,本文介绍一下如何接入deepseek。

  1. 首先需要在deepseek开放平台申请一个api key。可以搜索一下注册和应用的申请方法,记得记住自己的key。

  2. 进入指定文件路径,修改添加json文件。
    路径:C:\Users\自己的用户名\.config\PDFMathTranslate\config.json

    json文件格式如下:

json 复制代码
[
{
    "PDF2ZH_LANG_FROM": "English",
    "PDF2ZH_LANG_TO": "Simplified Chinese",
    "NOTO_FONT_PATH": "/app/SourceHanSerifCN-Regular.ttf",
    "translators": [
        {
            "name": "deepseek",
            "envs": {
                "DEEPSEEK_API_KEY": "sk-",
                # DEEPSEEK_API_KEY 填写自己的api key即可
                "DEEPSEEK_MODEL": "deepseek-chat"
            }
        }
    ]
}
]

其中,DEEPSEEK_MODEL设置为:deepseek-chat 调用 DeepSeek-V3 ,deepseek-reasoner 调用 DeepSeek-R1,但是使用推理模型翻译速度很慢。

然后即可按照正常的调用方式调用模型即可,如果想使用其他的翻译服务,可以参考项目的说明文档:说明文档。使用类似的json设置即可。

注意

  1. 如果遇到在图形界面翻译太久,文件翻译完成了,但是界面卡住了无法下载的情况,可以在路径\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh_files下查找翻译结果。
  2. 要使用对应的翻译服务主要就是在这个json文件中设置。
    C:\Users\自己的用户名\.config\PDFMathTranslate\config.json
  3. 在打开图形化界面后,可以在界面看到翻译进度,也可以在终端中看到进度。
  4. 如果使用的是windows的应用安装,也可以直接启动程序,然后在图形界面选择对应的服务,输入对应的key。

如有问题,欢迎指正。

相关推荐
AI Echoes29 分钟前
别再手工缝合API了!开源LLMOps神器LMForge,让你像搭积木一样玩转AI智能体!
人工智能·python·langchain·开源·agent
AI Echoes32 分钟前
从零构建企业级LLMOps平台:LMForge——支持多模型、可视化编排、知识库与安全审核的全栈解决方案
人工智能·python·langchain·开源·agent
beijingliushao1 小时前
58-正则表达式
数据库·python·mysql·正则表达式
陈敬雷-充电了么-CEO兼CTO1 小时前
具身智能多模态感知与场景理解:融合语言模型的多模态大模型
人工智能·python·gpt·语言模型·自然语言处理·chatgpt·多模态
荔枝吻1 小时前
【AI总结】Python BERT 向量化入门指南
人工智能·python·bert
张子夜 iiii2 小时前
传统神经网络实现-----手写数字识别(MNIST)项目
人工智能·pytorch·python·深度学习·算法
Rhys..2 小时前
python + Flask模块学习 1 基础用法
python·学习·前端框架·flask
飞翔的佩奇2 小时前
【完整源码+数据集+部署教程】骰子点数识别图像实例分割系统源码和数据集:改进yolo11-DCNV2
python·yolo·计算机视觉·数据集·yolo11·骰子点数识别图像实例分割
Source.Liu2 小时前
【Python基础】 13 Rust 与 Python 注释对比笔记
开发语言·笔记·python·rust
qq_195551692 小时前
代码随想录70期day3
开发语言·python