深入使用 skill-creator:结合真实生产级实践

Hi~大家好,我是三金。

最近一段时间一直在工作中摸索如何使用 AI 提效,整体收益较好。

开发效率相较之前大概提升了2-3倍,唯一会 block 的点就是 UI 测试,目前还在攻坚中(80% 的进度)。

主要是通过团队内部提供的 MCP,结合项目本身的一些工程化实践,将开发步骤 skill 化。再通过编排的形式,将一个个小的 skill 组合成一个大的 skill,实现半自动化开发。

为什么只是半自动化? 因为从前端的视角来看,全自动化无法保障生成质量。不单单的代码质量,还有交互质量、业务质量。所以一定需要人为参与、人为验收,在开发过程中给予指导,在开发完成后给予审核,人机协同。

在做 skill 开发的过程中,之前提到过的 skill-creator 依旧起到了很大的作用:

  • 从0到1辅助生成可使用在生产级的 skill。比如智能生成单测、根据需求自动创建变更及分支等。
  • 对已有的 skill 做优化迭代。初版的单测耗时长、token 消耗大,通过 prompt cache、多 agent 并行等手段,实现降本增效。
  • 修改其他团队的 skill,**将其"本地化"**为适合本团队项目的 skill。

这些概括起来其实就是:什么场景用什么策略

因为并不是所有 skill 创建都需要走完之前文章中说的五个步骤,也不是每个 skill 都需要从零开始。

让我们回顾一下之前说的 skill-creator 的五个步骤: 告诉 skill-creator 你的目标是什么 → 它根据目标来写 SKILL.md → 生成测试 prompt → 迭代 → 优化触发

哪些场景需要完全五步走呢?

  • 做一个全新的 skill,不确定边界。因为我们还不知道哪里会踩坑,让流程帮我们去趟一趟会更高效。
  • 涉及自动化脚本,比如数据处理、格式转换。类似的原因,eval 不但会进行流程测试,还会做脚本测试。
  • 脑爆类(主观输出)。

那哪些场景不需要五步走呢?

  • 已有 skill 迭代、魔改。这种时候会直接跳到第四步进行迭代优化
  • skill 写好但是不触发,直接跳到第五步,进行触发优化,问题大概率是在 description 上,不需要改正文。

简单总结一下就是:skill 越复杂、越要复用,就越值得让 skill-creator 走完全部流程

到目前为止,三金在实际工作中已经尝试了创建过很多个 skill,比如:

  • 和团队大佬合作搞的前端单测 Skill。除了有业界通用的规则外,还根据项目工程架构添加了对应的参考模板,保障了单测工程质量。
  • 自己倒腾的 AI e2e skill。结合自定义 prompt + chrome-devtools,在开发完需求之后,自动进行 UI 自动化测试,目前准确率能达到 80%。
  • 还有一个开头说的半自动化 skill。从需求解析、自动开发、智能单测,然后自动发布日常、自动 e2e 测试,最后反馈开发者,开发者根据结果再决定是否需要继续迭代。

还有一些零碎的 skill 就不在这里啰嗦了,接下来三金根据这些 skill 实践,浅谈一下实操指南

首先,最值得我们注意的一条规则是------什么内容应该放在 SKILL.md 中,什么应该放到 references 中,什么应该放到 scripts 中。

markdown 复制代码
内容该放哪?判断流程:

这个信息每次执行都需要吗?
├── 是 → 放 SKILL.md
└── 否 → 它是文档还是代码?
          ├── 文档/规则/样例 → references/
          └── 可执行逻辑 → scripts/

具体来说:

  • skill 的触发条件和工作流程,肯定是需要放在 SKILL.md 中的,因为每次执行都需要这个信息。
  • 对于团队规则来说,由于不是每次都变,相对来说比较稳定,所以我们一般会把它放到 references 中。
  • 模板类也是一样,属于稳定内容,也放在 references 中。
  • 一些流程可以使用脚本实现的,我们将其放到 scripts 中。

⚠️注意:SKILL.md 不要过长,最好控制在 500 行以内。超了就需要考虑进行拆分了。

其次,我们要有一个明确的目标,并知晓按照什么样的流程可以实现这个目标。

以 AI e2e 为例:

我的想法是,直接脱离 e2e 测试框架,以 AI + 测试用例的形式来实现 AI 浏览器自动化。因为在 e2e 框架中,代码是通过元素标记(自定义属性、文案等)来进行自动化交互的,那在 AI 时代,我只要写清楚流程,给清楚元素,理应也能达到相同的效果。

这是三金在实际工作中实践出来的最有用的一条路子。只需要三步:

首先,让 AI 通过分析指定分支的修改,推理出都改动了哪些内容。

然后,结合已有文档或者知识库,给出一份测试文档,并由开发者进行测试文档审查,审查通过后继续下一步。

最后,让 AI 根据测试文档,调用 chrome-devtools mcp 进行自动化测试,并对测试 case 进行截图保留。

听起来很简单对吧,事实就是如此。我们唯一要保证的是文档积累和人工审查,确保人和 AI 的上下文是一致的即可。

最后,把上述工作流交给 skill-creator 来做。

不断测试、迭代,根据团队或者项目规范增强约束,相信我,你会得到一整套令你满意的 skill。

相关推荐
wj3055853786 小时前
课程 9:模型测试记录与 Prompt 策略
linux·人工智能·python·comfyui
DevSecOps选型指南6 小时前
安全419专访悬镜安全 | 穿越周期在 AI 浪潮中定义数字供应链安全新范式
人工智能
沪漂阿龙6 小时前
面试题详解:GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透
人工智能·知识图谱
WangN26 小时前
Unitree RL Lab 学习笔记【通识】
人工智能·机器学习
haina20196 小时前
海纳AI亮相《科创中国》,解码招聘“智”变之路
人工智能·ai面试·ai招聘
阿星AI工作室7 小时前
刘润年中大课笔记:一句话说清AI落地之战的本质
大数据·人工智能·创业创新·商业
qingfeng154157 小时前
企业微信机器人开发:如何实现自动化与智能运营?
人工智能·python·机器人·自动化·企业微信
ChampaignWolf7 小时前
AI插件深度对比 | Copilot、Tabnine、Codeium谁是王者
人工智能·copilot
初心未改HD8 小时前
深度学习之CNN卷积层详解
人工智能·深度学习·cnn