写了个平时看论文可能会用上的工具

写了一款可以帮助经常阅读论文的同学提升效率的小工具,有两个部分:

  • HuggingFace Weekly Paper 制作工具
  • Arxiv Helper

前置条件

翻译基于 deepseek 的服务, 论文十问依赖于 kimi, 因此需要这两个的 api key。可以配置到环境变量中,代码中使用的环境变量 key 分别是

  • DEEPSEEK_KEY
  • KIMI_KEY

如果不想同时用两家,翻译可以考虑也换成 kimi,需要手动修改代码,将 deepseek 里面的设置换成 kimi的。

1. HuggingFace Weekly Paper 制作工具

我每周博客和公众号上都会发一篇 weekly paper,文章来源于 HuggingFace 的 Daily Paper。 为了减少每次都要一个个点进去通过N次复制粘贴来得到翻译后的结果的痛苦,写了个脚本,可以直接读取本周的点赞超过n次的论文,并生成Weekly Paper。

代码就是hf.py文件,运行 weekly_paper 方法即可,慢慢等待即可,如果出现了一些翻译上的问题或者接口异常,可以重新从目录下的output.md文件里面拿到英文原版继续人工处理。

此脚本依赖的模型是 deepseek.

2. Arxiv Helper

这个使用 streamlit 做了前端,输入框里面输入 arxiv 论文的首页地址,回车即可得到它的标题和摘要,左侧可以进行翻译,右侧是论文十问的模板,使用 kimi 的接口进行问答。

对pdf的读写是依赖于kimi的基于文件的问答,因此会上传文件到kimi,文件上传列表可以在设置页面看到(初版暂时没做文件上传去重处理),不需要的可以删除。文件本身也会下载到data目录,每篇论文对应一个文件夹,里面存放pdf以及数据json,避免每次都要重新调用接口。

使用方式:

shell 复制代码
streamlit run arxiv.py

后续计划

  1. arxiv helper 支持跳转到 kimi 聊天,并带上已经进行过的论文十问;
  2. 论文上传去重
  3. 本地论文管理(待定)

GitHub地址, 有用请点个 star,非常感谢!

相关推荐
慧一居士几秒前
通义灵码、Qoder‌ 、OpenCode、Meoo(秒悟) 几款AI产品功能对比,适用场景和对象全面对比及选型指南
人工智能
l1t几秒前
DeepSeek总结的DwarfStar 4:专为 DeepSeek V4 Flash 设计的小型原生推理引擎
人工智能
深圳市快瞳科技有限公司1 分钟前
低功耗设计:如何让AI宠物摄像头实现长达数月的续航?
人工智能
TENSORTEC腾视科技6 分钟前
超低功耗 性能卓越|腾视科技重磅推出TS-SG-SM9系列AI算力模组,引领边缘智能计算新篇章
人工智能·ai·算力模组·模组·ai算力·ai算力模组·ai模组
weixin_408099676 分钟前
医疗票据OCR API vs 在线工具:医院和企业该怎么选?
人工智能·ocr·石榴智能·ocr选型·医疗票据ocr·医疗ocr api·医疗数字化
沪漂阿龙6 分钟前
AI大模型面试题:决策树是什么?ID3、C4.5、CART、信息增益、剪枝一文讲透
人工智能·决策树·剪枝
deephub9 分钟前
Feature Engineering 实战:Pandas + Scikit-learn的机器学习特征工程的完整代码示例
人工智能·python·机器学习·pandas·scikit-learn
自动化测试行业观察10 分钟前
手机银行用户体验测评解决方案
人工智能·智能手机·ux
元拓数智11 分钟前
AI Agent 时代,企业数据治理底座如何支撑智能应用的安全与效率
大数据·人工智能·安全·数据治理·nl2sql·自然语言查询
节点云科11 分钟前
谷歌 Gemini Omni 深度解析:原生视频模型的技术突破与行业影响
人工智能·音视频