【7/3】热门skill清单:开源的AI记忆平台、自建知识图谱、网页操作、AI剪视频、PPT和UI设计

盯 AI Skill 这块的人最近应该都有个共同的累,信息太杂了。每天新 Skill、新插件、新框架冒出来,海外社区和 GitHub 上刷都刷不过来,看完还是不知道哪个值得动手。

我这周把这一圈梳了一遍。这篇不堆热闹,先给你一份能直接收藏、按需上手的清单,每个我都说清楚它是干嘛的、亮点在哪、适合谁;后半段再讲讲我从这一圈里看到的几个方向。

一、值得收藏的清单(按用途分)

1. 给你的 Agent 装一个「记不住东西」的解药 ------ cognee

仓库是 topoteretes/cognee。它是一个开源的 AI 记忆平台,核心是自建知识图谱,让 AI 助手能跨会话记住上下文,而不是聊两轮就失忆。

它不是简单存聊天记录,而是把你喂进去的资料抽成实体和关系,边用边自我优化,还能剪掉过时的旧信息。默认用轻量的本地存储,不强制上云,装好后能接到 Claude Code、Cursor 这类工具上,让 Agent 在你的项目里长期保持记忆。

适合谁:想让 AI 助手「记住你项目」的开发者,或者对 Agent 记忆这块基础设施感兴趣的人。

2. 让 AI 用自然语言直接操作网页 ------ page-agent(阿里)

仓库是 alibaba/page-agent。它是一个纯 JavaScript 写的、活在网页内部的 GUI Agent,你把它集成进自己的站点,用户就能用一句话操作页面。

它最巧的地方是不靠截图、不靠多模态识别,而是直接读页面的 DOM 结构来理解和操作,所以又快又准。典型用法比如把「填个表单点二十下」变成一句话说完,很适合 ERP、CRM、后台这类系统,也能给网页加上无障碍语音操作。开源、MIT 协议。

适合谁:想在自己产品里加个「AI 助手」的前端和产品同学。

3. 用 AI 来剪视频 ------ video-use

仓库是 browser-use/video-use,出自做浏览器自动化那个团队。思路是让 AI 用自然语言指挥剪辑,控制底层的 FFmpeg、字幕、调色这些环节。

它有个很聪明的设计,AI 从不去「看」视频画面(那样会烧掉海量算力),而是「读」音频转录稿,靠词级时间戳来精确剪辑。能自动剪掉「嗯、啊」这类口水词和空白、按风格烧字幕、剪辑点加淡入淡出防爆音,出片前还会自己检查一遍。

要提醒一句,它有门槛,得配 FFmpeg、还要用到语音转写的密钥,不是点一下就能跑。适合愿意折腾的内容创作者。

4. 让本地 Agent 做出像样的 PPT 和设计稿 ------ baoyu-design(宝玉)

仓库是 JimLiu/baoyu-design,作者是宝玉。它把「设计能力」做成了一个能在本地跑的 Agent Skill,支持 Cursor、Claude Code 等,能产出 UI 稿、原型、线框图和幻灯片,成品是自包含的 HTML。

对做 PPT 的人最实用的是,它能导出可编辑的 PPTX,也能导 PDF、甚至发送到 Figma、Canva,还能在 Agent 内置浏览器里预览、标记、改细节。安装用一行 npx skills add JimLiu/baoyu-design 就行。他还有个更全的合集叫 baoyu-skills,能从一篇 markdown 直接生成整套幻灯片。

适合谁:经常要出 PPT、又不想从空白页开始的人。

5. 给 AI 一份「设计规范说明书」------ design.md(Google)

仓库是 google-labs-code/design.md,Google Labs 出的。它其实是一种格式规范,用一个纯文本的 DESIGN.md 文件,把你的品牌配色、字体、组件规则写清楚,让不同的 AI 编程助手都能照着它生成风格统一的界面。

好处是它把「机器要的精确数值」和「人能懂的设计理念」放在同一个文件里,一份文档同时喂给人和 AI。想让 AI 每次做出来的东西风格一致、不跑偏,这是个挺聪明的解法。

适合谁:团队里有设计系统、又常用 AI 生成界面的人。

6. 让 AI 帮你查代码里的安全漏洞 ------ strix

仓库是 usestrix/strix,开源、Apache 协议。它是一组能自动做渗透测试的 AI Agent,会像真人安全测试员那样动态跑你的代码、找出漏洞,并用实际验证来确认这个漏洞是真的,而不是甩给你一份满是「疑似问题」的报告。

同样有门槛,它要配大模型密钥、要装 Docker,深度扫描还会产生一定的调用成本。另外必须强调一句,这类工具只能用来测试你自己拥有、或已获得授权的系统,别拿去碰别人的。

适合谁:想在上线前给自己项目做一遍安全自查的开发团队。

二、从这份清单里,我看到的几个方向

把上面这些串起来看,其实能看出这阵子生态在往哪走。⭐

一是 Agent 的「记忆」正在成为地基。 cognee 这类项目热度不低不是偶然。一个能连着帮你干几个小时活的助手,前提是它得记得住,不然体验就是碎的。记忆这块,很多人当成「必须先解决」的基础设施在做。

二是编程 Agent 从工具变成了平台。 你看 page-agent、baoyu-design、video-use 全都是「装进某个 Agent 里当 Skill 用」的形态。主流的编程工具这阵子几乎都在补插件和 Skill 系统,比的已经不是谁会写代码,而是谁的生态更全。

三是设计和多媒体能力在「卷质量」。 从 baoyu-design 到 Google 的 design.md,再到用 AI 剪视频,方向很一致,AI 做设计、做视频,早就过了「能不能做」的阶段,现在比的是「做得好不好看、够不够能直接用」。

三、顺带说个安全坑

热闹归热闹,有个风险这周也被摆到了台面上。

有安全研究者发现,社区里出现了伪装的 Skill 和组件,借着知名项目的名头夹带私货、绕过审查。对喜欢直接从社区装各种 Skill 的人来说,这是个实打实的隐患。

几条务实建议:装之前先确认仓库和维护者是不是真的靠谱;优先选协议清晰、有人长期维护的成熟项目;凡是要用到你 API 密钥的 Skill,多留意它怎么保管这些密钥。热闹可以追,手别太快。

写在最后

这一周捋下来我的感受是,AI Skill 这块正在从「比谁功能多」进入「比谁记得住、编排得好、还安全」的阶段。上面这份清单你可以先收藏着,挑一两个跟你场景对得上的动手试试,比光看热闹强。

⭐我会接着盯这块,有新的信号再来跟你唠。