智能盒子-Agent-Skill-执行逻辑架构

智能盒子-Agent-Skill-执行逻辑架构

在 智能盒子的架构中,Agent Skill(智能插件/工具) 的执行逻辑是一个从"非结构化语音输入"到"结构化指令执行",再到"感知反馈"的完整闭环。

它基于 MCP (Model Context Protocol) 协议,通过 Function Calling 机制实现。以下是详细的执行逻辑拆解:


1. 整体执行流程图

Agent Skill 的执行不是孤立的,它与意图识别、长短期记忆以及情感引擎深度耦合。


2. 核心执行阶段

第一阶段:意图识别与工具匹配 (Intent Routing)
  1. 语音转文字 (ASR):用户输入(如:"帮我看看明天武汉要不要带伞")。
  2. 意图路由 (Router):中台根据用户话术解析意图。如果识别为"查询类"或"控制类",则进入 Skill 匹配流程。
  3. 可用工具检索 (Discovery) :系统从 Available Tools 库中根据当前上下文检索匹配的 Skill 定义(如:get_weather)。
第二阶段:参数抽取与指令生成 (Parameter Extraction)
  1. 大模型推理:将用户输入与选定的工具 Meta 信息(JSON Schema)投喂给 LLM。
  2. 结构化输出 :LLM 不直接回答问题,而是输出符合标准的 JSON 指令
    • 示例{"tool": "weather_service", "params": {"city": "Wuhan", "date": "tomorrow"}}
  3. MCP 插件下沉:通过 MCP 协议将该 JSON 指令分发至具体的业务逻辑层或边缘端(ESP32)。
第三阶段:任务编排与执行 (Orchestration & Execution)
  1. 原子化拆解:对于复杂任务(如:"先帮我开灯,然后查一下最近的新闻"),编排引擎会将请求拆分为多个顺序或并行的 Skill 调用。
  2. 闭环执行
    • 外部调用:访问天气 API、搜索接口或 IoT 指令。
    • 异常处理:若工具调用失败(如接口超时),系统需捕获 Error 并反馈给 LLM 进行自愈或提示用户。
第四阶段:感知更新与结果润色 (Feedback & Response)
  1. 记忆写入 :执行结果(如:"武汉明天有雨")会被存入短期记忆
  2. 情绪/亲密度反馈
    • 成功执行 :触发 on_skill_success,根据 PRD 逻辑,增加 AI 的支配感(Dominance)和用户亲密度(Intimacy += 0.01)。
  3. 最终回复生成 :LLM 结合执行结果与当前性格/情绪状态,生成拟人化的语音回复。

3. 基于 Go-zero 的技术实现细节

在你的项目中,这套逻辑在代码层面通常表现为以下链路:

  • 定义层 (Schema) :在 go-zero 的插件服务中定义各 Skill 的输入输出规范。

  • 调用层 (Invocation)

    Go

    复制代码
    // 简化后的工具调度逻辑
    func (s *SkillEngine) Execute(ctx context.Context, call ToolCall) (string, error) {
        // 1. 意图分发
        handler, ok := s.registry[call.FunctionName]
        if !ok { return "", ErrToolNotFound }
    
        // 2. 权限/上下文检查 (结合 RAG 记忆)
    
        // 3. 业务逻辑执行
        result, err := handler.Do(ctx, call.Arguments)
    
        // 4. 反馈给情绪引擎更新 PAD 状态
        s.moodService.UpdateByAction(call.FunctionName, err == nil)
    
        return result, nil
    }

4. 关键特性:MCP 协议的意义

通过引入 MCP (Model Context Protocol),你的 Agent Skill 具备了以下优势:

  • 标准化:无论 Skill 是运行在云端(天气预报)还是边缘端 ESP32(红外控制),其接口协议是统一的。
  • 动态性:LLM 可以根据当前对话的上下文,动态决定是否需要"增加"某个临时工具,实现真正的任务编排。
  • 安全隔离:大模型只负责"决策"调用哪个工具,而"执行"权在受控的插件系统中,避免了注入风险。

总结: Agent Skill 的执行逻辑是 "识别 -> 拆解 -> 执行 -> 反馈"。在 智能盒子中,它不仅完成了功能交付,更通过执行结果的反馈,驱动了 AI 长期记忆的更新和情感状态的起伏。

相关推荐
一水鉴天12 小时前
不确定性问题确定解的 DevOps 九宫格内核 20260612(腾讯元宝)
人工智能·架构
志栋智能12 小时前
超自动化巡检:知识沉淀与团队协作的新载体
大数据·运维·网络·数据库·人工智能·自动化
小短腿的代码世界12 小时前
Qt行情协议解析与二进制编解码优化:从FIX到自定义协议的全链路架构
开发语言·qt·架构
酣大智12 小时前
策略路由PBR--企业双出口实验
网络·智能路由器·策略路由·pbr
袁小皮皮不皮12 小时前
1.HCIP BFD 学习笔记(优化版)
服务器·网络·笔记·网络协议·学习·智能路由器·ip
是温不嗜温13 小时前
QR 准谐振反激架构:当下中小功率快充的主流选择
架构·电源管理·电源芯片·ac-dc
AI焦点13 小时前
2026年AI应用架构:如何避坑并选对API聚合中转服务?
大数据·人工智能·架构
梁辰兴13 小时前
计算机网络基础:数据加密模型
网络·计算机网络·计算机·数据加密·计算机网络基础·梁辰兴·数据加密模型
fofantasy13 小时前
NSK LH12AN 微型导轨技术手册
运维·网络·数据库·经验分享·规格说明书
网络系统管理13 小时前
第八届江苏技能状元大赛“信息通信网络运行管理”项目技术文件
网络