写了个平时看论文可能会用上的工具

CareyWYR2024-07-13 21:13

写了一款可以帮助经常阅读论文的同学提升效率的小工具，有两个部分：

前置条件

翻译基于 deepseek 的服务，论文十问依赖于 kimi，因此需要这两个的 api key。可以配置到环境变量中，代码中使用的环境变量 key 分别是

如果不想同时用两家，翻译可以考虑也换成 kimi，需要手动修改代码，将 deepseek 里面的设置换成 kimi的。

我每周博客和公众号上都会发一篇 weekly paper，文章来源于 HuggingFace 的 Daily Paper。为了减少每次都要一个个点进去通过N次复制粘贴来得到翻译后的结果的痛苦，写了个脚本，可以直接读取本周的点赞超过n次的论文，并生成Weekly Paper。

代码就是hf.py文件，运行 weekly_paper 方法即可，慢慢等待即可，如果出现了一些翻译上的问题或者接口异常，可以重新从目录下的output.md文件里面拿到英文原版继续人工处理。

此脚本依赖的模型是 deepseek.

这个使用 streamlit 做了前端，输入框里面输入 arxiv 论文的首页地址，回车即可得到它的标题和摘要，左侧可以进行翻译，右侧是论文十问的模板，使用 kimi 的接口进行问答。

对pdf的读写是依赖于kimi的基于文件的问答，因此会上传文件到kimi，文件上传列表可以在设置页面看到（初版暂时没做文件上传去重处理），不需要的可以删除。文件本身也会下载到data目录，每篇论文对应一个文件夹，里面存放pdf以及数据json，避免每次都要重新调用接口。

使用方式：

shell 复制代码

streamlit run arxiv.py

GitHub地址，有用请点个 star，非常感谢！