我最近在做一个股票情绪分析 Dashboard的副业项目。一边要跑量化策略回测,一边还得赶 Web 前端。一个人的团队,效率是生死线。
就在这个时候,我刷到了 Matt Pocock 的这个仓库:mattpocock/skills。Matt 是 TypeScript 生态里的知名开发者(Total TypeScript 的作者),他把自己日常配合 Claude Code 工作的 "Agent Skills" 开源了出来。
开源三周,23k Star,1.9k Fork。这个数字在一个如此垂直的开发者工具里,属于现象级。
我用了将近两周,把其中最核心的几个 Skill 在真实项目里跑了一遍。今天来聊聊真实体验。
操作环境Claude桌面端,(如果你还没有Claude,国内用户去这里订阅:claudemax.shop)
先说结论
值得用,但不是所有人都适合,也不是所有 Skill 都同等重要。
它解决的核心问题只有一个:阻止 AI 在没想清楚之前就开始写代码。
这听起来很简单,但如果你用 Claude Code 做过稍微复杂点的项目,你一定知道那种痛:你说"我要加个用户认证",AI 立刻噼里啪啦开始改文件,等它写完,你发现它对"用户"的理解和你完全不一样。
Skills 的本质,是把"强迫 AI 先思考再行动"这件事标准化、可复用化。
安装:极其简单
bash
npx skills@latest add mattpocock/skills/grill-me
npx skills@latest add mattpocock/skills/tdd
npx skills@latest add mattpocock/skills/to-prd
npx skills@latest add mattpocock/skills/git-guardrails-claude-code
安装后 Skill 文件放在 .claude/skills/ 目录下,在 Claude Code 的对话里直接 /skill-name 触发。没有任何全局依赖,不需要配置,零门槛。
四个核心 Skill 实测
1. grill-me --- 最值钱的一个
使用场景:在写任何代码之前,先把需求想清楚。
我拿股票 Dashboard 项目测了这个 Skill。输入:/grill-me 我想做一个AI股票分析 Dashboard,展示市场情绪。
接下来的 25 分钟里,Claude 问了我 16 个问题。部分问题摘录:
- "实时"的精度是秒级还是分钟级?(这直接决定是否需要付费 API)
- "市场情绪"用什么衡量?RSI?新闻 NLP?社交媒体情感评分?
- 用户是自己用还是给别人用?如果给别人用,需要多租户吗?
- 情绪数据和价格数据的刷新频率一样吗?如果不一样,状态管理怎么设计?
这些问题,我在动手写代码之前,一个都没想过。
这就是 grill-me 最大的价值。它不是帮你写代码,它是帮你把"模糊的想法"逼成"清晰的规格"。开发者最大的时间浪费往往不是写代码,而是写了错误方向的代码然后推倒重来。
按 Matt 自己的描述,他曾有过接近 50 个问题的追问会话。对于复杂系统,这不是夸张,而是正常。
评分:★★★★★ 强烈推荐
2. tdd --- 代码质量的基石
使用场景:写任何新功能或修 Bug。
这个 Skill 把经典的红绿重构循环(Red-Green-Refactor)内置进了 AI 的工作流里。关键在于它不是让 AI"随便加测试",而是严格要求:
- 先写失败的测试(Red)
- 只写能让测试通过的最小实现(Green)
- 在测试通过的保护下重构(Refactor)
- 循环,直到这个垂直切片完成
我在对接 Yahoo Finance 数据接口时用了这个 Skill。最直观的感受是:AI 不再会写出"看起来能用但边界情况全漏"的代码了。因为测试先行强迫它在写实现之前就想清楚了接口契约。
按 Matt 的说法,tdd 这个 Skill 内容是最重的,包含了他对重构哲学、Mock 使用原则和模块边界的完整思考。
一个实际好处:对于我这种金融应用开发者,数据解析逻辑里有大量边界情况(空数据、非交易日、停牌股票)。TDD 驱动下,这些边界情况在写主逻辑之前就变成了测试用例,而不是上线后才发现的 Bug。
评分:★★★★☆ 推荐,但需要你的代码库本身有清晰的模块边界
3. git-guardrails-claude-code --- 让你睡得着觉
使用场景:所有使用 Claude Code 自动执行 Git 操作的场景。
这个 Skill 设置了 Claude Code hooks,拦截以下危险命令:
git push --forcegit reset --hardgit clean -fd- 其他可能造成不可逆数据丢失的操作
说实话这个功能看起来很"小",但它解决的是一个真实的恐惧:AI agent 的自主性越高,意外破坏代码历史的风险就越大。
我以前就遇到过 AI 想"清理一下没用的分支"然后误操作的情况。有了这个护栏,危险操作会被强制拦截,必须你手动去终端执行------这个摩擦成本足以让你停下来想想"我真的要做这件事吗"。
评分:★★★★★ 免费的保险,没理由不装
4. to-prd + to-issues --- 项目管理闭环
使用场景:把 grill-me 的对话结果转化为可执行的开发任务。
工作流是这样的:
vbnet
grill-me(深度追问)
↓
to-prd(生成产品需求文档,自动提交 GitHub Issue)
↓
to-issues(把 PRD 拆成独立的垂直切片 Issue)
↓
tdd(逐个 Issue 开发)
这个链路对我这种独立开发者来说是真实有用的------不是所谓的"最佳实践表演",而是切实减少了"我下一步该干啥"的决策摩擦。
每个生成的 Issue 都是"可独立完成的垂直切片",不存在循环依赖。这个设计哲学来自于软件工程的 Vertical Slice 理念,确保每个任务都能独立交付价值。
评分:★★★★☆ 需要配合 GitHub 工作流使用,不用 GitHub 的话价值打折
哪些 Skill 我没在用,为什么
migrate-to-shoehorn :专为 Total TypeScript 生态设计,迁移 as 类型断言到特定库。高度垂直,普通项目用不上。
scaffold-exercises:为教学内容生成练习目录结构。Matt 做课程卖,这个对他是刚需,对我没用。
obsidian-vault:我用的不是 Obsidian,直接跳过。
这里有一个重要观点:Skills 生态最大的意义不是用别人的 Skills,而是用 write-a-skill 这个 Skill 来写自己的 Skills。
Matt 这个仓库的价值是示范性的------它告诉你 Skills 应该是什么结构,应该怎么写,可以解决什么类型的问题。你自己的工作流你自己最了解,最终你应该有一套属于自己项目的 Skills 库。

从金融应用开发者的视角谈几点
在金融类应用里,有几个痛点是通用 AI 工具无法直接覆盖的,但 Skills 框架给了我启发:
合规性文档生成 :to-prd 的模式可以改造成生成符合监管要求的技术方案文档(国内涉及金融数据的应用需要特定材料)。
数据解析的边界测试 :用 tdd 处理金融数据解析,强迫考虑所有异常情况(停牌、退市、除权除息)。这是我真实用过且有效的场景。
代码审计准备 :ubiquitous-language 可以帮你从代码库里提炼出统一的业务语言词汇表,在做合规审计或接受外部代码审查前非常有用。
局限性和不适合的场景
坦率地说:
不适合快速原型。如果你只是想验证一个想法,grill-me + to-prd 的流程会显得冗长。这套工具链是为"要认真做的项目"设计的,不是为了"先出个 Demo"。
需要代码库有清晰结构 。tdd 和 improve-codebase-architecture 对代码质量有前提要求。在一个乱成一锅粥的遗留系统上用,效果会大打折扣。
与团队工具绑定 。to-issues 强依赖 GitHub Issues。用 Jira、Linear 或内部系统的团队需要自己改造。
Skills 不是魔法。它们是精心设计的系统提示词。AI 的能力上限没有变,变的是它思考问题的框架和顺序。遇到真正复杂的领域知识(比如特定行业的业务规则),Skills 无法替代领域专家的判断。
建议:怎么上手这套东西
如果你是 Claude Code 用户,我的建议是这样的分阶段上手:(如果你还没有Claude,国内用户推荐去这里订阅:claudemax.shop)
第一周 :只装 grill-me 和 git-guardrails。前者改变思维习惯,后者纯安全兜底。没有任何学习成本,立竿见影。
第二周 :在一个新功能开发中试一次 tdd。不要在老代码上试,找一个从零开始的模块来体验完整的红绿重构循环。
第三周 :跑完 grill-me → to-prd → to-issues → tdd 这条完整链路一次。
之后 :用 write-a-skill 写你自己工作流里最重复的流程,建立属于自己项目的 Skills 库。
最后
Matt Pocock 在 README 里用了一个措辞:"for real engineers, not vibe coding"(为真正的工程师,不是为了玩玩 AI 氛围感)。
这句话有点犀利,但说到了点子上。这套工具的设计哲学是:AI 是工具,工程师是主角。Skills 不是让你把控制权交给 AI,而是让你用更好的方式指挥 AI。
对于像我这样同时要处理金融逻辑和 Web 开发的独立开发者来说,这个心智模型比"一键生成整个项目"更接近真实工作的样子。
推荐。
本文基于 mattpocock/skills 仓库截至 2026 年 4 月的版本。
如果你也在做量化/金融 Web 应用,欢迎交流。