大概两个月前,我发现自己的阅读习惯变了。
以前每天早上通勤会刷一遍 36氪、IT之家、Hacker News、TechCrunch......一天不刷就焦虑,怕错过什么大新闻。刷完又觉得浪费了不少时间 ------ 标题党、重复内容、跟我不相关的领域。
我试着用 RSS 聚合,信息过载没解决,反而更焦虑了。用 Newsletter,又觉得编辑的口味跟我不太一样。
后来我想:如果让 AI 自己帮我刷,按我的口味筛选、排序、写摘要,是不是就行了?
于是有了这个项目 ------ KeepMeUpdate。
它干了什么
简单说,这是一个装在 Hermes Agent 上的「技能」(skill)。每天我跟它说一句「今天有啥新鲜事」,它就会:
- 从 28 个 RSS 源抓一圈(HN、TechCrunch、Ars Technica、GitHub Trending、arXiv、36氪、IT之家......)
- 在网上搜几轮补充当天热点
- AI 自己判断哪些重要、哪些是广告/水文,筛掉
- 按「今日头条」「AI 前沿」「极客/开源」「科技公司」「硬件」分好类
- 每条写一两句导读
- 最后输出到终端,或者写成 Markdown 文件丢进笔记库
整个过程不需要我碰任何 API key,也不用装 Python 包------纯标准库。
真正有意思的部分
我最初觉得最难的部分是链接保真。
AI 模型有个毛病:它记不住精确的 URL。你跟它说「Fox 收购 Roku」,它可能凭记忆编一个 techcrunch.com/fox-roku 之类的假链接。这在写代码时可能问题不大,但做新闻摘要 ------ 链接是命根子。点进去发现不对,整篇东西的可信度就崩了。
我的解法是在流程里加了程序化的链接验证:
- 第一步:记录 RSS 和搜索结果中所有出现过的真实 URL
- 第二步:对比每条待发布新闻的 URL 是否在这个池子里
- 不在池子里 → 按标题关键词模糊匹配,匹配到就换,匹配不到直接删
- 写完文件还要全量发一次 HTTP 请求验证每个链接是不是 200
这套组合下来,至少我跑了一周多还没出现过假链接。
为什么要用「AI Skill」而不是写个脚本
其实市面上已经有 submato/ai-daily 这类纯 Python 的日报生成器了。它们用的是硬编码的打分逻辑(源权重 × 关键词分数 × 时效系数),好处是可复现、没 AI 也能跑。
但我想要的是判断力。比如:
- NVIDIA 发 250 亿债券 → 这条应该放头条,因为金额大、市场信号强
- 某公司发布了新款充电宝 → 这条可以放硬件区,但不能放头条
- 某篇 arXiv 论文证明了大模型的安全对齐可以被绕过 → 这条虽然没上 HN 首页,但很重要
这些判断很难用公式量化。但 AI 模型看一眼标题和摘要,基本就能做对。这就是「AI skill」相比纯脚本的差异 ------ 它不谈算法,它用理解力干活。
一些数据
跑了一周多,每天的数据大概是:
- RSS 源 28 个,成功 25-27 个
- 新增文章 60-85 篇
- 筛选后收录 15-27 条
- 全程耗时约 10-15 分钟(主要在 RSS 抓取等网络 I/O)
怎么用
如果你也在用 Hermes Agent(Nous Research 的开源 AI agent 框架),安装很简单:
bash
# 直接装
hermes skills install https://raw.githubusercontent.com/Nemocccc/KeepMeUpdate/main/SKILL.md
或者:
bash
git clone https://github.com/Nemocccc/KeepMeUpdate.git
cp -r KeepMeUpdate ~/.hermes/skills/keep-me-update
已经发布到 ClawHub(OpenClaw 的技能市场),也可以 openclaw skills install @nemocccc/keep-me-update。
首次触发时,Agent 会问 4 个问题:语言、时区、输出方式、RSS 源(可以用内置的 28 个源,也可以自己提供)。配置存本地文件,之后不用再问。
代码和反馈
仓库在 github.com/Nemocccc/Ke...。欢迎 Star、提 Issue、加新 RSS 源。
如果你也在做类似的东西,或者有什么好源推荐,欢迎交流。
最后说一句:标题的「每天早上帮我刷科技新闻」严格来说是它帮我筛选和摘要,刷还是它刷的,我看的是结果。:)