写了个平时看论文可能会用上的工具

写了一款可以帮助经常阅读论文的同学提升效率的小工具,有两个部分:

  • HuggingFace Weekly Paper 制作工具
  • Arxiv Helper

前置条件

翻译基于 deepseek 的服务, 论文十问依赖于 kimi, 因此需要这两个的 api key。可以配置到环境变量中,代码中使用的环境变量 key 分别是

  • DEEPSEEK_KEY
  • KIMI_KEY

如果不想同时用两家,翻译可以考虑也换成 kimi,需要手动修改代码,将 deepseek 里面的设置换成 kimi的。

1. HuggingFace Weekly Paper 制作工具

我每周博客和公众号上都会发一篇 weekly paper,文章来源于 HuggingFace 的 Daily Paper。 为了减少每次都要一个个点进去通过N次复制粘贴来得到翻译后的结果的痛苦,写了个脚本,可以直接读取本周的点赞超过n次的论文,并生成Weekly Paper。

代码就是hf.py文件,运行 weekly_paper 方法即可,慢慢等待即可,如果出现了一些翻译上的问题或者接口异常,可以重新从目录下的output.md文件里面拿到英文原版继续人工处理。

此脚本依赖的模型是 deepseek.

2. Arxiv Helper

这个使用 streamlit 做了前端,输入框里面输入 arxiv 论文的首页地址,回车即可得到它的标题和摘要,左侧可以进行翻译,右侧是论文十问的模板,使用 kimi 的接口进行问答。

对pdf的读写是依赖于kimi的基于文件的问答,因此会上传文件到kimi,文件上传列表可以在设置页面看到(初版暂时没做文件上传去重处理),不需要的可以删除。文件本身也会下载到data目录,每篇论文对应一个文件夹,里面存放pdf以及数据json,避免每次都要重新调用接口。

使用方式:

shell 复制代码
streamlit run arxiv.py

后续计划

  1. arxiv helper 支持跳转到 kimi 聊天,并带上已经进行过的论文十问;
  2. 论文上传去重
  3. 本地论文管理(待定)

GitHub地址, 有用请点个 star,非常感谢!

相关推荐
qcx237 分钟前
【系统学AI】23 AI 时代产品运营与获客全景:CRM SaaS 大变局 + 增长新范式(2026 调研报告)
人工智能·产品运营·产品设计·ai agent·ai native
叶修_A8 分钟前
【COZE-08】Prompt工程进阶 - 结构化输出与思维链
大数据·人工智能·prompt
John_ToDebug10 分钟前
开源与人性:DeepSeek 战略的底层逻辑
人工智能·经验分享·ai
老吴胡编13 分钟前
eknife 2026.05.28 v0.0.5 更新 —— 支持 PDF 文档合并
人工智能·嵌入式硬件·个人开发
OCR_1337162127513 分钟前
技术实测|2026三款主流OCR横向对比:SDK15、PaddleOCR、GLM-OCR选型指南
大数据·人工智能
深蓝电商API14 分钟前
当爬虫遇见大模型:AI驱动的智能数据采集新范式
人工智能·爬虫
陈天伟教授15 分钟前
图解人工智能(37)人工智能应用-车牌识别
人工智能·深度学习
Agent手记15 分钟前
电商智能客服的退换货自动处理流程如何配置?——2026企业级Agent全链路实战指南
人工智能·ai
wuhen_n17 分钟前
阿里云百炼平台 API 接入教程(附 Node.js + TypeScript 实战)
前端·人工智能·阿里云·ai编程
wuyuanshun17 分钟前
人工智能学习总结(一)
人工智能·学习