PDFMathTranslate 安装、使用及接入deepseek

PDFMathTranslate 安装、使用及接入deepseek

介绍

PDFMathTranslate 是非常好用的科学 PDF 文档翻译及双语对照工具,可以将论文按照其原本的排版结构执行多种语言翻译,并且可以接入如:谷歌翻译、deepl、deepseek、chatgpt 等工具,是十分高效的翻译工具,项目的github网址为:PDFMathTranslate

我就是在看其他人的帖子的时候看到了这个翻译工具,但是当我使用时候发现需要自己设置一下翻译服务才能使用如谷歌翻译、deepseek等服务,但是我看了一下网上,基本上很多教程讲述如何安装使用,但是没有介绍如何配置服务(也有可能是我没找到)然后我摸索了一下,找到了配置文件的位置,然后就想简单写一个记录,期望可以帮助到他人。

安装及使用

PDFMathTranslate 项目在介绍文件中提供了多种的安装和使用方法,可以直接按照方法安装即可。

例如:

  1. 使用Windows exe需要下载指定的压缩包:pdf2zh-v1.9.6-win64.zip,解压后运行pdf2zh.exe ("\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh.exe")即可打开本地网页上传文件翻译。
  2. 使用python图形用户界面,可以直接使用 pip 安装指定的包,然后执行指定命令即可打开图形化界面。
bash 复制代码
pip install pdf2zh

执行 pdf2zh -i 即可打开图形界面

bash 复制代码
pdf2zh -i

接入deepseek

PDFMathTranslate支持接入多种翻译服务,本文介绍一下如何接入deepseek。

  1. 首先需要在deepseek开放平台申请一个api key。可以搜索一下注册和应用的申请方法,记得记住自己的key。

  2. 进入指定文件路径,修改添加json文件。
    路径:C:\Users\自己的用户名\.config\PDFMathTranslate\config.json

    json文件格式如下:

json 复制代码
[
{
    "PDF2ZH_LANG_FROM": "English",
    "PDF2ZH_LANG_TO": "Simplified Chinese",
    "NOTO_FONT_PATH": "/app/SourceHanSerifCN-Regular.ttf",
    "translators": [
        {
            "name": "deepseek",
            "envs": {
                "DEEPSEEK_API_KEY": "sk-",
                # DEEPSEEK_API_KEY 填写自己的api key即可
                "DEEPSEEK_MODEL": "deepseek-chat"
            }
        }
    ]
}
]

其中,DEEPSEEK_MODEL设置为:deepseek-chat 调用 DeepSeek-V3 ,deepseek-reasoner 调用 DeepSeek-R1,但是使用推理模型翻译速度很慢。

然后即可按照正常的调用方式调用模型即可,如果想使用其他的翻译服务,可以参考项目的说明文档:说明文档。使用类似的json设置即可。

注意

  1. 如果遇到在图形界面翻译太久,文件翻译完成了,但是界面卡住了无法下载的情况,可以在路径\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh_files下查找翻译结果。
  2. 要使用对应的翻译服务主要就是在这个json文件中设置。
    C:\Users\自己的用户名\.config\PDFMathTranslate\config.json
  3. 在打开图形化界面后,可以在界面看到翻译进度,也可以在终端中看到进度。
  4. 如果使用的是windows的应用安装,也可以直接启动程序,然后在图形界面选择对应的服务,输入对应的key。

如有问题,欢迎指正。

相关推荐
Calm_dw3 分钟前
github上传本地文件到远程仓库(空仓库/已有文件的仓库)
python·github
wolf犭良10 分钟前
8、Python 字符串处理与正则表达式实战指南
python·正则表达式
范哥来了17 分钟前
python 数据可视化TVTK库安装与使用
开发语言·python·信息可视化
rzjslSe33 分钟前
【PyTorch基础】PyTorch还支持线性代数运算?PyTorch的内置线性代数运算示例
人工智能·pytorch·python
沉默的八哥2 小时前
CentOS 7.9 安装 Python 3.10 详细步骤及常见问题解决
linux·python·centos
幸福清风3 小时前
【OCR】使用Umi-OCR进行PDF文档的光学字符识别
pdf·ocr
大博士.J6 小时前
MySQL实现全量同步和增量同步到SQL Server或其他关系型库
数据仓库·人工智能·python·mysql·adb
Sunshine_Cherish6 小时前
当Anaconda的安装路径与我想创建的conda虚拟环境路径不一致时,应该怎么操作?
python·conda·anaconda
FreakStudio7 小时前
一文速通Python并行计算:00 并行计算的基本概念
python·嵌入式·面向对象·电子diy
myzzb7 小时前
python字符级差异分析并生成 Word 报告 自然语言处理断句
python·学习·自然语言处理·word·snownlp