hermes-kanban-技术架构学习与调研

一、项目概述

1.1 什么是 Hermes Kanban

Hermes Kanban 是 Hermes Agent v0.12.0 版本引入的多智能体任务编排系统，基于 SQLite 持久化看板，支持任务拆解、角色分派、并行执行与自动状态流转。它将抽象的项目目标转化为结构化、可分配、可追踪的卡片式任务单元，每个卡片绑定特定 AI 角色与执行上下文，支持并行处理与状态自动更新。

Hermes Agent 是由 Nous Research 开发的开源自主进化 AI 智能体框架（MIT 协议），GitHub Star 已突破 10万+，核心定位是"与你一起成长的智能体"（The agent that grows with you）。

1.2 项目背景

维度	信息
开发团队	Nous Research（知名开源大模型实验室）
开源协议	MIT
核心语言	Python（93.6%）
首次发布	2026年2月
GitHub	https://github.com/NousResearch/hermes-agent
Kanban模块引入版本	v0.12.0
当前最新版本	v0.13.0

1.3 解决的核心问题

传统单 Agent 模式处理复杂工作流时存在三大痛点：

任务阻塞：多步骤串行执行，一步卡住全流程停滞
状态丢失：会话结束后任务进度不可追踪，无法断点续传
协同混乱：多角色混在同一上下文中，能力冲突、职责不清

Hermes Kanban 通过将看板方法论（源自精益生产）与 AI Agent 编排相结合，解决了上述问题。

二、架构设计

2.1 整体架构

Hermes Agent 是一个事件驱动的分层架构 系统，结合了插件化设计 和微服务化组件模式。Kanban 模块作为其中的核心任务编排层，位于架构中间位置：

2.2 Kanban 模块核心设计

2.2.1 数据模型

Kanban 系统采用 SQLite 作为持久化存储，核心数据模型：

父任务卡片 (Parent Task)：顶层任务节点，包含拆解规则和角色列表
子任务卡片 (Sub Task)：拆解后的原子任务，绑定角色和执行上下文
任务状态机 ：pending → assigned → running → completed / failed / blocked
关系映射 ：父子任务通过 parent_id 建立层级关系

持久化文件路径：~/.hermes/kanban.db

2.2.2 角色化智能体分派

每个 Kanban 任务卡片可绑定特定的 Agent Profile（角色），实现职能分离：

角色	职责	典型技能
researcher	信息调研与摘要	web-search, summarize
engineer	代码生成与执行	code-gen, terminal-exec
reviewer	质量审查与评审	code-review, security-audit
executor	流程执行与操作	terminal-exec, file-ops
reporter	报告生成与输出	report-gen, chart-gen

每个 Profile 由独立的 SOUL.md 定义身份特征与行为边界，确保不同 AI 成员专注各自领域。

三、核心功能详解

3.1 看板任务编排

初始化与创建

bash 复制代码

# 1. 初始化看板环境
hermes kanban init

# 2. 创建父任务并指定拆解规则
hermes kanban create \
  --title "生成Q4多平台兼容性测试报告" \
  --split 5 \
  --roles researcher,engineer,reviewer,executor,reporter

# 3. 验证持久化
# 检查 ~/.hermes/kanban.db 文件是否存在且包含非空 records 表

任务状态流转

任务创建
角色分派 - 绑定 Agent Profile
开始执行
执行成功
执行失败
依赖阻塞
重试
阻塞解除
pending
assigned
running
completed
failed
blocked

实时监控

bash 复制代码

# 查看指定任务的完整执行日志流
hermes kanban tail

# 通过 Web UI 可视化查看看板状态

3.2 代理委托（Delegate）并行执行

主 Agent 通过动态生成子 Agent 实例，在隔离终端会话中并行处理子任务：

bash 复制代码

# 1. 确认委托工具已注册
# 检查 tools/__init__.py 中是否包含:
# from .delegate_tool import DelegateTool

# 2. 在 SOUL.md 中添加并行策略指令
# when task_complexity > 3: use delegate_tool with max_subagents=4

# 3. 启动带委托能力的 Agent
hermes run --enable-delegate --max-delegate-workers 4

关键特性：

各子 Agent 拥有独立上下文 、工具作用域 与迭代预算
子 Agent 间互不干扰，零上下文开销
支持通过 RPC 调用工具

3.3 Cron 调度器

将重复性高、时效性强的子任务交由内置 Cron 调度器管理：

yaml 复制代码

# ~/.hermes/crontab.yaml
- schedule: "0 */2 * * *"
  job: "kanban_sync --status pending"

支持两种触发模式：

定时触发：基于 Cron 表达式的时间触发
条件触发：基于外部事件（如文件变更、Git Push、API 响应）触发

bash 复制代码

# 启动调度服务
hermes cron start

# 查看调度状态
hermes cron status
# 输出: Active: true, Next fire: [timestamp]

3.4 轨迹保存与回溯

所有工作流执行过程以 JSONL 格式写入轨迹文件，同步至 SQLite 会话数据库：

系统提示（System Prompts）
用户输入（User Inputs）
工具调用（Tool Calls）
子 Agent 输出（Sub-Agent Outputs）
错误堆栈（Error Traces）

bash 复制代码

# 轨迹文件路径
# ~/.hermes/trajectories/*.jsonl

# 会话搜索
hermes session_search "failed at kanban_complete"

支持任意节点状态还原与问题复现。

3.5 持久化记忆系统

基于 SQLite FTS5 全文搜索配合 LLM 摘要，实现跨会话持久记忆：

自动评估：智能判断什么值得记、什么该忘
主动召回：适时主动回忆相关经验
技能沉淀：成功经验自动提炼为 Markdown 格式技能文件
用户建模：基于 Honcho 的辩证法用户建模，深度理解用户偏好

四、技术栈分析

4.4 跨平台支持

平台	支持情况	备注
Linux	原生支持	推荐部署环境
macOS	原生支持	Intel / Apple Silicon
Windows	通过 WSL2	需管理员权限

五、集成与生态

5.1 多平台统一网关

一套配置多端运行：

平台	类型	特色功能
Telegram	即时通讯	语音备忘录转录
Discord	社区协作	多服务器管理
Slack	企业集成	工作流自动化
WhatsApp	个人助手	移动端交互
Signal	隐私通讯	端到端加密
飞书 (Lark)	办公协同	企业级集成
企业微信	办公协同	扫码登录
Email	异步通信	邮件自动化
CLI	开发者工具	全功能 TUI

5.2 工具生态

40+ 内置工具：网页搜索、终端执行、文件读写、浏览器自动化、视觉识别、图像生成、语音合成、代码执行等
40+ 内置技能：涵盖 MLOps、GitHub 工作流、研究等
社区技能市场：支持从 ClawHub、LobeHub、GitHub 安装社区技能

5.3 Web UI（第三方）

Hermes Web UI（https://github.com/EKKOLearnAI/hermes-web-ui）提供了全功能 Web 管理面板：

多会话 AI 聊天管理（SSE 流式对话）
8 大平台渠道统一配置
精细化成本与用量监控
可视化定时任务管理
模型与文件管理

六、与竞品对比

七、典型应用场景

7.1 多角色 AI 协同开发

用户需求 - 构建用户登录系统
父任务卡片 - Kanban 自动拆解
researcher - UI 设计稿输出
engineer - 后端 API 实现
engineer - 前端组件开发
reviewer - 安全审查
reporter - 测试报告生成

7.2 自动化运维

定时巡检 + 异常报警 + 自动修复
通过 Cron + Kanban 编排实现无人值守

7.3 研究数据处理

文献检索 → 数据采集 → 清洗分析 → 报告生成
多步骤长周期任务全流程可追踪

7.4 项目管理

AI 自动拆解需求、分派任务、追踪进度
支持人工干预和断点续传

八、部署指南

8.1 快速安装

bash 复制代码

# 一键安装（Linux / macOS）
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 刷新 shell 配置
source ~/.zshrc  # 或 ~/.bashrc

# 初始化
hermes setup

8.2 硬件要求

项目	最低要求
CPU	x86_64 / ARM64
内存	256MB
存储	100MB
网络	稳定联网

8.3 Docker 部署

bash 复制代码

docker run -d \
  -v ~/.hermes:/root/.hermes \
  -p 8080:8080 \
  nousresearch/hermes-agent:latest

九、优劣势分析

9.1 优势

闭环学习系统：经验→技能→能力提升的进化闭环，越用越聪明
结构化编排：看板式任务管理，状态可视、可追踪、可恢复
角色隔离：多 Profile 实现职能分离，避免能力冲突
持久化记忆：跨会话知识沉淀，SQLite + FTS5 高效检索
并行加速：Delegate 机制支持零上下文开销的并行处理
模型无关：200+ 模型一键切换，零代码变更
生态丰富：40+ 内置工具/技能，社区技能市场
安全加固：沙箱隔离、注入扫描出厂自带
MIT 协议：完全自由的使用、修改和商用

9.2 劣势与风险

项目成熟度：2026年2月才开源，距今仅3个月，生产环境需谨慎评估
文档质量：快速迭代中，部分文档可能滞后于代码
社区规模：虽然 Star 数高，但深度贡献者有限
性能瓶颈：SQLite 在高并发场景可能成为瓶颈
模型依赖：核心能力仍依赖外部 LLM API，存在成本和延迟风险
Kanban 可视化：原生 CLI 交互，Web UI 依赖第三方项目
中文支持：文档和社区以英文为主，中文资源较少

十、选型建议

10.1 推荐使用场景

需要 AI 多角色协同完成复杂任务
需要跨会话保持任务状态和记忆
需要 AI 自主学习并沉淀技能
对数据隐私有要求（自托管）
个人/团队长期使用的 AI 助手

10.2 不推荐使用场景

简单的问答/聊天场景（过度设计）
对延迟极度敏感的实时交互场景
对系统稳定性有极高要求的生产环境（项目仍处于快速迭代期）
无技术能力的终端用户（需要一定开发和运维能力）

十一、总结

Hermes Kanban 是 Hermes Agent 框架中最具创新性的模块之一，它将看板方法论与 AI Agent 编排深度融合，通过 SQLite 持久化、角色化分派、并行执行和闭环学习，实现了从"一次性工具"到"长期数字伙伴"的范式转变。项目以 MIT 协议开源，社区活跃度高（10万+ Star），技术架构先进，生态丰富，是目前 AI Agent 领域最值得关注的开源项目之一。

但同时也需注意，项目仍处于快速迭代期（v0.13.0），在生产环境落地前需要进行充分的稳定性测试和风险评估。建议先在非关键业务场景进行试点验证，逐步积累经验后再扩大应用范围。