PDFMathTranslate 安装、使用及接入deepseek

PDFMathTranslate 安装、使用及接入deepseek

介绍

PDFMathTranslate 是非常好用的科学 PDF 文档翻译及双语对照工具,可以将论文按照其原本的排版结构执行多种语言翻译,并且可以接入如:谷歌翻译、deepl、deepseek、chatgpt 等工具,是十分高效的翻译工具,项目的github网址为:PDFMathTranslate

我就是在看其他人的帖子的时候看到了这个翻译工具,但是当我使用时候发现需要自己设置一下翻译服务才能使用如谷歌翻译、deepseek等服务,但是我看了一下网上,基本上很多教程讲述如何安装使用,但是没有介绍如何配置服务(也有可能是我没找到)然后我摸索了一下,找到了配置文件的位置,然后就想简单写一个记录,期望可以帮助到他人。

安装及使用

PDFMathTranslate 项目在介绍文件中提供了多种的安装和使用方法,可以直接按照方法安装即可。

例如:

  1. 使用Windows exe需要下载指定的压缩包:pdf2zh-v1.9.6-win64.zip,解压后运行pdf2zh.exe ("\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh.exe")即可打开本地网页上传文件翻译。
  2. 使用python图形用户界面,可以直接使用 pip 安装指定的包,然后执行指定命令即可打开图形化界面。
bash 复制代码
pip install pdf2zh

执行 pdf2zh -i 即可打开图形界面

bash 复制代码
pdf2zh -i

接入deepseek

PDFMathTranslate支持接入多种翻译服务,本文介绍一下如何接入deepseek。

  1. 首先需要在deepseek开放平台申请一个api key。可以搜索一下注册和应用的申请方法,记得记住自己的key。

  2. 进入指定文件路径,修改添加json文件。
    路径:C:\Users\自己的用户名\.config\PDFMathTranslate\config.json

    json文件格式如下:

json 复制代码
[
{
    "PDF2ZH_LANG_FROM": "English",
    "PDF2ZH_LANG_TO": "Simplified Chinese",
    "NOTO_FONT_PATH": "/app/SourceHanSerifCN-Regular.ttf",
    "translators": [
        {
            "name": "deepseek",
            "envs": {
                "DEEPSEEK_API_KEY": "sk-",
                # DEEPSEEK_API_KEY 填写自己的api key即可
                "DEEPSEEK_MODEL": "deepseek-chat"
            }
        }
    ]
}
]

其中,DEEPSEEK_MODEL设置为:deepseek-chat 调用 DeepSeek-V3 ,deepseek-reasoner 调用 DeepSeek-R1,但是使用推理模型翻译速度很慢。

然后即可按照正常的调用方式调用模型即可,如果想使用其他的翻译服务,可以参考项目的说明文档:说明文档。使用类似的json设置即可。

注意

  1. 如果遇到在图形界面翻译太久,文件翻译完成了,但是界面卡住了无法下载的情况,可以在路径\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh_files下查找翻译结果。
  2. 要使用对应的翻译服务主要就是在这个json文件中设置。
    C:\Users\自己的用户名\.config\PDFMathTranslate\config.json
  3. 在打开图形化界面后,可以在界面看到翻译进度,也可以在终端中看到进度。
  4. 如果使用的是windows的应用安装,也可以直接启动程序,然后在图形界面选择对应的服务,输入对应的key。

如有问题,欢迎指正。

相关推荐
m5655bj1 天前
使用 Python 高效复制 Excel 行、列、单元格
开发语言·python·excel
龙言龙论1 天前
身份证信息批量处理系统:从入门到实战(附exe工具+核心源码)
数据库·python
m0_626535201 天前
代码分析 长音频分割为短音频
javascript·python·音视频
Wpa.wk1 天前
自动化测试环境配置-java+python
java·开发语言·python·测试工具·自动化
带刺的坐椅1 天前
AI 应用工作流:LangGraph 和 Solon AI Flow,我该选谁?
java·python·ai·solon·flow·langgraph
工业互联网专业1 天前
图片推荐系统_django+spider
python·django·毕业设计·源码·课程设计·spider·图片推荐系统
Lwcah1 天前
Python | LGBM+SHAP可解释性分析回归预测及可视化算法
python·算法·回归
@一辈子爱你1 天前
归来九十余日:在时代的夹缝中,与你共筑一道光
python
q***01771 天前
SpringBoot实战(三十二)集成 ofdrw,实现 PDF 和 OFD 的转换、SM2 签署OFD
spring boot·后端·pdf
HsuHeinrich1 天前
利用面积图探索历史温度的变化趋势
python·数据可视化