PDFMathTranslate 安装、使用及接入deepseek

PDFMathTranslate 安装、使用及接入deepseek

介绍

PDFMathTranslate 是非常好用的科学 PDF 文档翻译及双语对照工具,可以将论文按照其原本的排版结构执行多种语言翻译,并且可以接入如:谷歌翻译、deepl、deepseek、chatgpt 等工具,是十分高效的翻译工具,项目的github网址为:PDFMathTranslate

我就是在看其他人的帖子的时候看到了这个翻译工具,但是当我使用时候发现需要自己设置一下翻译服务才能使用如谷歌翻译、deepseek等服务,但是我看了一下网上,基本上很多教程讲述如何安装使用,但是没有介绍如何配置服务(也有可能是我没找到)然后我摸索了一下,找到了配置文件的位置,然后就想简单写一个记录,期望可以帮助到他人。

安装及使用

PDFMathTranslate 项目在介绍文件中提供了多种的安装和使用方法,可以直接按照方法安装即可。

例如:

  1. 使用Windows exe需要下载指定的压缩包:pdf2zh-v1.9.6-win64.zip,解压后运行pdf2zh.exe ("\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh.exe")即可打开本地网页上传文件翻译。
  2. 使用python图形用户界面,可以直接使用 pip 安装指定的包,然后执行指定命令即可打开图形化界面。
bash 复制代码
pip install pdf2zh

执行 pdf2zh -i 即可打开图形界面

bash 复制代码
pdf2zh -i

接入deepseek

PDFMathTranslate支持接入多种翻译服务,本文介绍一下如何接入deepseek。

  1. 首先需要在deepseek开放平台申请一个api key。可以搜索一下注册和应用的申请方法,记得记住自己的key。

  2. 进入指定文件路径,修改添加json文件。
    路径:C:\Users\自己的用户名\.config\PDFMathTranslate\config.json

    json文件格式如下:

json 复制代码
[
{
    "PDF2ZH_LANG_FROM": "English",
    "PDF2ZH_LANG_TO": "Simplified Chinese",
    "NOTO_FONT_PATH": "/app/SourceHanSerifCN-Regular.ttf",
    "translators": [
        {
            "name": "deepseek",
            "envs": {
                "DEEPSEEK_API_KEY": "sk-",
                # DEEPSEEK_API_KEY 填写自己的api key即可
                "DEEPSEEK_MODEL": "deepseek-chat"
            }
        }
    ]
}
]

其中,DEEPSEEK_MODEL设置为:deepseek-chat 调用 DeepSeek-V3 ,deepseek-reasoner 调用 DeepSeek-R1,但是使用推理模型翻译速度很慢。

然后即可按照正常的调用方式调用模型即可,如果想使用其他的翻译服务,可以参考项目的说明文档:说明文档。使用类似的json设置即可。

注意

  1. 如果遇到在图形界面翻译太久,文件翻译完成了,但是界面卡住了无法下载的情况,可以在路径\pdf2zh-v1.9.6-win64\pdf2zh\build\pdf2zh_files下查找翻译结果。
  2. 要使用对应的翻译服务主要就是在这个json文件中设置。
    C:\Users\自己的用户名\.config\PDFMathTranslate\config.json
  3. 在打开图形化界面后,可以在界面看到翻译进度,也可以在终端中看到进度。
  4. 如果使用的是windows的应用安装,也可以直接启动程序,然后在图形界面选择对应的服务,输入对应的key。

如有问题,欢迎指正。

相关推荐
算法_小学生21 分钟前
LeetCode 热题 100(分享最简单易懂的Python代码!)
python·算法·leetcode
230万光年的思念42 分钟前
【无标题】
python
shengli7221 小时前
机器学习与人工智能
jvm·数据库·python
2301_765703141 小时前
Python迭代器(Iterator)揭秘:for循环背后的故事
jvm·数据库·python
追风少年ii1 小时前
多组学扩展---分子对接pyrosetta
python·数据分析·空间·单细胞
2301_821369612 小时前
使用Python进行图像识别:CNN卷积神经网络实战
jvm·数据库·python
m0_561359672 小时前
使用Kivy开发跨平台的移动应用
jvm·数据库·python
小咖自动剪辑2 小时前
Base64与图片互转工具增强版:一键编码/解码,支持多格式
人工智能·pdf·word·媒体
编程火箭车2 小时前
04.第一个 Python 程序:Hello World 从编写到运行全解析
python·python第一个程序·python入门报错解决·python新手教程·hello world 程序·python终端运行·pycharm运行代码
qq_423233902 小时前
如何用FastAPI构建高性能的现代API
jvm·数据库·python