skill-creator 大更新

Elwin Wong2026-02-26 13:52

今天skill-creator进行了一次大更新，基本上是进行了一次重构，使得 skill 的创建流程更加严谨和完整。

主要更新内容

SKILL.md 文档大幅重构

描述更新：

旧版：Guide for creating effective skills. This skill should be used when
users want to create a new skill...
新版：Create new skills, modify and improve existing skills, and measure
skill performance. Use when users want to create a skill from scratch,
update or optimize an existing skill, run evals to test a skill, benchmark
skill performance with variance analysis, or optimize a skill's description
for better triggering accuracy.

新增核心功能：

完整的评估和迭代循环 - 现在支持定量基准测试和定性评估
描述优化 - 自动优化技能描述以提高触发准确度
盲比较系统 - 用于严格评估两个技能版本的质量
平台特定指令 - 针对 Claude.ai、Claude Code 和 Cowork 的不同适配

新增脚本工具

新增脚本	功能
aggregate_benchmark.py	聚合基准测试数据，计算 mean/stddev/min/max
generate_report.py	生成 HTML 报告
improve_description.py	使用 Claude 扩展思考优化技能描述
run_eval.py	运行评估测试
run_loop.py	运行评估+改进循环，支持 train/test split 防止过拟合
utils.py	工具函数

新增 Agent 指令文件

agents/analyzer.md - 如何分析为什么一个版本胜过另一个
agents/comparator.md - 如何进行盲 A/B 比较
agents/grader.md - 如何评估断言与输出

新增评估查看器

eval-viewer/generate_review.py - 生成交互式评估查看器
eval-viewer/viewer.html - 查看器前端
assets/eval_review.html - 用于描述优化的评估审查模板

删除的文件

scripts/init_skill.py - 初始化脚本被移除
references/workflows.md - 工作流参考被移除
references/output-patterns.md - 输出模式参考被移除

新增参考文件

references/schemas.md - JSON 结构文档（evals.json, grading.json 等）

核心改进总结

这次更新将 skill-creator 从一个简单的技能创建指南转变为一个完整的技能开发和评估框架，包含：

自动化测试和评估流程 - 支持并行运行测试、基准测试、盲比较
描述自动优化 - 使用 Claude 扩展思考自动优化技能描述
交互式查看器 - 浏览器内审查测试结果和反馈
防过拟合机制 - train/test split 确保描述优化不只在测试集上有效
从一个指令式的"如何创建技能"文档，变成了一个完整的"创建、测试、评估、优化"循环框架

上一篇：obsidian md github站点

下一篇：【SLAM】GenRobot / IO-AI / Scale / Appen 能力对比表（机器人数据与闭环视角）

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 年 AI 大模型 & AI 编程工具实战全总结 10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新