过去 3 年,我一直在做教育相关的事情。
这几年接触过很多和教育有关的场景:学生学习、家长陪学、老师备课、作业练习、错题复盘、考试复习、知识点讲解、学习计划等等。
刚开始做 AI 教育时,我也和很多人一样,会很自然地想:
是不是只要写几个 Prompt,套上大模型,就能做一个 AI 老师?
但做了一段时间之后,我越来越觉得,教育场景远比想象中复杂。
教育不是一个简单的"问答场景"。
它更像是一套长期陪伴、持续反馈、不断调整的流程系统。
比如一个学生问:
"这道题我不会。"
这句话背后其实有很多隐含信息:
- 他是几年级?
- 当前学到什么阶段?
- 这道题属于哪个知识点?
- 他是真的完全不会,还是某一步卡住了?
- 应该直接讲答案,还是先引导?
- 要不要补一个类似题?
- 要不要记录到错题本?
- 要不要生成复习建议?
如果是家长问同样的问题,输出方式又不一样。
如果是老师问同样的问题,可能需要的是讲解思路、变式题、课堂设计和作业安排。
所以这几年下来,我最大的感受是:
AI 教育真正难的地方,不是让模型"回答",而是让它在正确的教育场景里做正确的事情。
基于这个思考,我最近把自己这几年做教育相关项目时积累的一些经验,整理成了一个开源项目:
Hermes Edu Skills
GitHub 地址:
text
https://github.com/zhongweiv/hermes-edu-skills
它不是一个简单的 Prompt 合集,而是一套面向中文教育场景的 Agent Skill Pack。
目前项目里已经整理了 170 个可安装 Skill,覆盖:
- 教材同步
- 学习能力
- 每日练习
- 阅读写作
- 考试备考
- 老师工具
- 家庭教育
- 语言学习
- 成人学习
如果你也在做 AI 教育、Agent、学习助手、老师工具、错题系统或者题库产品,希望这篇文章能给你一些参考。
一、这几年做教育项目后,我对 AI 教育有几个变化很大的认知
刚开始看 AI 教育,很容易被"AI 老师""AI 家教""拍照答疑""自动批改"这些概念吸引。
这些当然都很有价值。
但真正做项目之后,我发现教育场景里有几个问题非常关键。
1. 教育不是通用聊天,必须有场景边界
大模型本身很强,但它默认是一个通用助手。
通用助手的问题是:它什么都能说,但不一定知道当前教育任务的边界在哪里。
比如学生问一道数学题,如果模型直接给出完整答案,可能短期看起来很爽,但长期看不一定有利于学习。
更好的方式可能是:
- 先判断知识点;
- 再判断学生卡在哪一步;
- 先给提示;
- 再给过程;
- 最后给一个类似题巩固。
也就是说,教育 AI 不应该只是"回答正确",还要考虑"怎么帮助学习真正发生"。
这也是我后来更倾向于用 Skill 来组织能力的原因。
Skill 可以把一个教育任务的目标、边界、输入参数、输出结构提前定义好,而不是每次都让模型临场发挥。
2. 教育产品不能只按"学科"拆能力
很多教育项目一开始会按学科拆:
- 语文
- 数学
- 英语
- 物理
- 化学
- 生物
- 历史
- 地理
- 政治
这个思路没错,但不够。
因为真实使用时,用户不是只说"我要数学",而是会说:
帮我出 20 道三年级口算题。
帮我复盘这道错题。
帮我做一份期末复习计划。
帮我讲一下八年级下册物理浮力。
帮我写一份家校沟通话术。
帮我生成一份课堂练习。
帮我陪孩子背古诗。
这些任务同时涉及:
- 学段
- 学科
- 教材
- 角色
- 任务类型
- 输出形式
- 使用频率
所以 Hermes Edu Skills 在设计时,没有只按学科拆,而是结合了"产品场景"和"教育任务"。
比如:
- 教材同步是一类;
- 错题复盘是一类;
- 每日练习是一类;
- 老师工具是一类;
- 家庭教育又是一类。
这种拆法更接近真实产品,也更方便后续接入 Agent。
3. 教育 Agent 需要长期记忆,但不能什么都记
这几年做教育相关项目时,我经常会思考一个问题:
AI 学习助手到底应该记住什么?
它当然应该记住一些长期有用的信息,比如:
- 学生年级
- 教材版本
- 薄弱知识点
- 常错题型
- 学习目标
- 每天练习情况
- 近期考试安排
但它不应该什么都记。
教育场景里的记忆应该服务于学习,而不是变成一个杂乱的聊天记录仓库。
所以如果以后要基于 Hermes Edu Skills 做完整教育 Agent,我觉得比较合理的结构是:
text
短期上下文:当前对话、当前题目、当前任务
阶段记忆:最近一周 / 一个单元的学习情况
长期画像:年级、教材、能力水平、薄弱点
学习事件:错题、练习、测试、复习记录
反馈机制:根据学习结果调整后续任务
Skill 在这里扮演的角色,就是让每一次学习行为变得更结构化,方便后续记录、分析和调整。
4. 家长、学生、老师其实需要的是不同的 AI
同样是教育,但不同角色的需求完全不同。
学生需要的是:
- 讲得懂
- 不打击人
- 能一步一步引导
- 能及时练习
- 能帮他从不会到会
家长需要的是:
- 知道孩子哪里不会
- 知道怎么陪学
- 知道怎么沟通
- 知道什么时候该帮,什么时候该放手
老师需要的是:
- 备课更快
- 出题更方便
- 作业更有层次
- 班级学情更清楚
- 家校沟通更省力
所以一个教育 Agent 如果只用一个统一 Prompt 服务所有人,很容易失控。
我的做法是把不同角色的任务拆到不同 Skill 里。
这不一定是唯一答案,但至少在工程上更容易维护,也更容易逐步迭代。
二、为什么我最后选择用 Skill Pack 的方式整理这些能力
这几年我尝试过很多方式来组织 AI 教育能力。
最早可能就是简单 Prompt。
比如:
text
你是一个小学数学老师,请帮我......
这种方式上手很快,也适合验证想法。
但问题也很明显:
- Prompt 越写越长;
- 很多内容重复;
- 不同能力之间边界不清楚;
- 很难做版本管理;
- 很难复用;
- 很难接入工具链;
- 也很难让 Agent 自动选择。
后来我越来越觉得,教育 AI 需要的不是一堆散乱 Prompt,而是一套可以被发现、安装、调用、组合和维护的能力系统。
这就是 Hermes Edu Skills 的基本思路。
每个 Skill 都是一个相对独立的教育能力单元。
它可以描述:
- 这个 Skill 解决什么问题;
- 适合什么角色;
- 需要哪些输入参数;
- 输出应该是什么结构;
- 应该遵守哪些教育原则;
- 什么时候不应该使用;
- 是否需要工具调用;
- 是否适合和其他 Skill 组合。
这种方式更像是在搭一个教育 Agent 的"能力库"。
三、Hermes Edu Skills 现在是什么状态
目前这个项目已经整理了 170 个可安装 Skill。
整体分成 9 大类:
- 教材同步
- 学习核心能力
- 每日练习
- 阅读写作
- 考试备考
- 教师工具
- 家庭教育
- 语言学习
- 成人与职业学习
项目里不只是放 Markdown 文件,还包含了:
text
skills/ 具体 Skill 内容
catalog.json Skill 目录索引
.well-known/skills/index.json Skill discovery 入口
bin/hermes-edu-skills.mjs CLI 入口
scripts/validate.mjs 校验脚本
scripts/agent-pack.mjs Agent Pack 导出脚本
CONTRIBUTING.md 贡献说明
SECURITY.md 安全说明
.github/workflows/validate.yml GitHub Actions 校验流程
也就是说,它不是一个临时整理的文档仓库,而是尽量按照一个可维护、可扩展、可安装的开源包来设计。
四、技术设计上,我重点考虑了几个问题
1. Skill 的颗粒度不能太粗,也不能太细
这是我觉得教育 Agent 设计里很重要的一点。
如果 Skill 太粗,比如只有一个:
text
education-assistant
那它又变成了万能 Prompt,内部逻辑会越来越复杂。
但如果 Skill 太细,比如拆成:
text
一年级上册语文第一课
一年级上册语文第二课
二年级上册数学第一单元第一课时
八年级物理浮力选择题
八年级物理浮力填空题
那数量会爆炸,也很难维护。
所以我现在更倾向于:
能力按任务拆,具体年级、教材、单元、知识点作为参数传入。
比如"教材同步学习"可以是一个 Skill,但它需要支持:
- 学段
- 年级
- 学科
- 教材版本
- 册别
- 单元
- 课时
- 知识点
- 难度
- 输出类型
这样既保留了教育场景的结构,又避免把 Skill 拆成无限多个碎片。
2. Skill 要能被机器读取,而不是只给人看
如果只是给人看,README 写清楚就够了。
但 Agent 需要的是可读取、可匹配、可安装、可调用。
所以项目维护了:
text
catalog.json
.well-known/skills/index.json
这两个文件的作用类似于 Skill Registry 的索引层。
未来无论是 Hermes Agent,还是其他 Agent Runtime,都可以通过索引知道:
- 有哪些 Skill;
- 每个 Skill 属于什么分类;
- slug 是什么;
- 路径在哪里;
- 适合什么任务;
- 如何安装或导出。
这也是我没有只做"文章式整理"的原因。
开源项目要想真正被复用,结构化索引很重要。
3. CLI 是为了降低使用门槛
教育项目里有一个常见问题:
设计得很完整,但用户跑不起来。
所以我加了 CLI。
目前可以通过类似下面的命令使用:
bash
# 安装全部 Skill 到 Hermes Agent
npx hermes-edu-skills install hermes --config ~/.hermes/config.yaml
也可以按分类安装:
bash
# 只安装教材同步分类
npx hermes-edu-skills install hermes textbook-sync --config ~/.hermes/config.yaml
搜索 Skill:
bash
npx hermes-edu-skills search 错题
查看 Skill:
bash
npx hermes-edu-skills info agent-mistake-review
自然语言匹配 Skill:
bash
npx hermes-edu-skills ask "帮我出5道八年级下册物理力学选择题"
我个人非常看重 ask 这种方式。
因为真实用户不会记住 Skill 名称。
用户只会说自然语言。
所以一个好的 Agent Skill 系统,不能要求用户先理解内部结构,而应该通过路由层自动匹配合适的能力。
4. 校验机制很重要
Skill 一多,最容易出问题的是一致性。
比如:
- catalog 里有,但文件不存在;
- 文件存在,但 catalog 没登记;
- frontmatter 不完整;
- 分类写错;
- 作者字段缺失;
- discovery index 不一致。
这些问题手动检查非常痛苦。
所以项目里加了校验脚本和 GitHub Actions。
每次提交时都可以检查:
- Skill 数量;
- 索引一致性;
- frontmatter;
- source;
- author;
- discovery index。
这对开源项目很重要。
因为只有结构稳定,别人以后才敢基于它二次开发。
五、这个项目适合谁参考
我觉得 Hermes Edu Skills 不只是给 Hermes Agent 用户看的。
如果你在做下面这些方向,也可以参考里面的设计:
- AI 学习助手
- 拍照答疑
- 错题本
- AI 老师
- 智能题库
- 老师备课工具
- 家校沟通工具
- 教育 SaaS
- 儿童陪学产品
- 成人学习助手
- Agent Runtime
- Skill Registry
- Prompt 工程化管理
你可以直接使用其中的 Skill,也可以只参考它的分类方式、命名方式、参数设计和 CLI 思路。
尤其是如果你正在做中文教育场景,我觉得它能节省不少前期梳理成本。
因为教育场景最麻烦的地方,往往不是模型调用,而是"到底应该拆哪些能力"。
六、我对教育 Agent 后续的一些判断
这几年做下来,我越来越觉得,教育 AI 会从"聊天式产品"慢慢走向"任务式 Agent"。
也就是说,未来用户不是打开一个聊天框随便问,而是进入一个具体学习流程:
text
今天要练什么?
哪里薄弱?
错题怎么复盘?
下一步补什么?
多久复习一次?
老师怎么布置?
家长怎么看结果?
在这个过程中,大模型只是其中一层。
完整系统还需要:
- Skill 路由
- 学习记忆
- 知识点图谱
- 题目生成
- 答题记录
- 错题分析
- 阶段报告
- 家校沟通
- 长期反馈
Hermes Edu Skills 现在只是其中的 Skill 层。
但我觉得这是一个很重要的基础层。
因为只有先把教育任务拆清楚,后面的记忆、工具、知识库、题库和评测才有落点。
七、为什么选择开源
选择开源,一方面是希望这个项目能被更多人看到、使用和反馈。
另一方面,也是因为我觉得中文教育 AI 还有很多基础工作值得大家一起做。
现在很多 AI 应用都在追热点,但教育不是一个短平快的方向。
它需要长期打磨:
- 要懂教材;
- 要懂学生;
- 要懂家长;
- 要懂老师;
- 要懂考试;
- 还要懂产品和工程。
一个人很难把所有场景都做完。
所以我希望先把自己这几年沉淀的一部分东西拿出来,作为一个开放起点。
如果有人愿意基于它继续扩展 Skill、优化分类、接入更多 Agent Runtime、补充更多教材场景,那这个项目就更有意义。
八、后续计划
后面我准备继续做这些事情:
- 继续补充更多高质量 Skill;
- 完善 Skill 的质量等级和审核状态;
- 增加更多教材同步场景;
- 补充更多使用示例;
- 支持更多 Agent Runtime 导出;
- 增强自然语言 Skill 匹配能力;
- 补充工具调用场景;
- 探索和长期学习记忆结合;
- 整理更多教育 Agent 产品化实践。
如果后续 Hermes / OpenClaw / Codex / Cursor / Claude Code 等工具链都有更成熟的 Skill 机制,我也会继续适配。
最后,欢迎交流,也求一个 Star
如果你也在关注 AI 教育、Agent、老师工具、错题系统、学习助手、中文教育场景,欢迎看看这个项目:
text
https://github.com/zhongweiv/hermes-edu-skills
如果觉得这个方向有价值,也欢迎帮忙点一个 Star。
这个 Star 对我来说,不只是一个数字。
它更像是一个反馈:说明这个方向有人关注,也说明中文教育 Agent 的基础能力建设值得继续做下去。
我也欢迎大家提 Issue、提建议、提 PR,或者只是聊聊你在教育 AI 场景里遇到的问题。
这几年做教育相关项目,我最大的感受是:
教育 AI 不应该只追求"回答得像老师",
更应该追求"真的能帮助学习发生"。
希望这个项目能成为一个小小的起点。