认知执行技能
认知套件(想)+ 执行框架(编程做),覆盖认知与代码执行类任务。
所有操作类型------代码生成、工具调用、技能插件、纯认知输出------均为统一基元,可由编排引擎自由组合为任意复杂度的执行链条。
架构总览
┌─────────────────────────────────┐
│ 用户请求 │
└──────────────┬──────────────────┘
↓
┌──────────────────────────────────┐
│ 任务路由器 │
│ 判断任务类型 → 选择执行层 │
└──────┬──────────────────┬────────┘
↓ ↓
┌────────────┐ ┌──────────────┐
│ 认知层 │ │ 编程执行层 │
└────────────┘ └──────────────┘
纯大语言模型 大语言模型+命令
执行工具
─────────────────────────────────
┌──────────────────────────────────┐
│ 编排引擎 │
│ 将两层的任意原子操作 │
│ 组合为执行链条 │
└──────────────────────────────────┘
两层各有所长,按任务主要操作类型选择入口:
- 认知为主 → 认知层(模式提示词套件 + 大语言模型)
- 代码执行为主 → 编程执行层(大语言模型 + 命令执行工具)
超级任务(跨层、多步骤、复杂编排)→ 编排引擎调度两层原子操作构成执行链条。
任务路由器
加载本技能后,按以下逻辑自动判断任务类型并选择执行层:
收到用户任务
│
├─ 涉及多种操作类型或超多步骤? ──→ 编排引擎
│ (跨层组合、命令序列、自动化流水线...)
│
├─ 需要写代码/跑脚本? ──→ 第二层:执行框架
│ (数据处理、文件操作、接口调用、构建应用...)
│
└─ 分析/思考/创作? ──→ 第一层:认知套件
(写作、分析、推理、规划、翻译、总结...)
混合任务(如"写个脚本帮我批量处理图片然后生成报告"):
- 先用第一层构思方案
- 再用第二层写脚本执行
注意:两层和引擎可自由组合,不必非此即彼。路由器只是默认起点,可根据任务需要自动跨层调度。
编排引擎
将两层的任意原子操作统一为基元,组合为执行链条,实现超级复杂、超多步骤的任务。
基元定义
所有可执行的操作均为原子基元,共四类:
| 类别 | 来源 | 示例 |
|---|---|---|
| 代码执行基元 | 第二层执行框架 | 大语言模型即时生成的 Python 脚本、命令行指令 |
| 工具调用基元 | 宿主环境内置工具 | 文件读写、命令执行、搜索、网页访问等 |
| 技能插件基元 | 已安装的其他技能 | 通过 use_skill 加载的外部技能能力 |
| 认知输出基元 | 第一层四种模式 | 大语言模型直接生成的分析、文案、方案、推理结果 |
编排协议
基于模式直用提示词的核心机制------"复杂任务分拆成简单任务交给基元构成链条执行"------扩展为完整的多步编排协议:
1. 拆解
大语言模型将用户任务拆解为有序的基元序列。
每个基元标注类别(代码/工具/插件/认知)和预期输出。
2. 规划
确定基元之间的依赖关系和数据流向。
前序基元的输出可作为后序基元的输入。
3. 执行
按序执行每个基元,实时检查输出是否符合预期。
每个基元执行后,大语言模型判断是否需要调整后续步骤。
4. 修复
任一基元执行失败时,大语言模型分析错误原因,
自主选择:重试当前基元 / 替换为等价基元 / 调整后续计划 / 终止并报告。
5. 汇总
所有基元执行完毕后,将整体结果汇总为人类可读的输出。
编排规则
- 优先使用大语言模型:能用认知输出基元解决的步骤,不生成代码;能用单条命令解决的,不写脚本。
- 安全规则贯穿:编排链中的每个基元都受第二层安全机制约束,高危操作必须用户确认。
- 智能插桩:可在基元之间插入认知输出基元做中间判断(如"分析上一步输出,决定下一步怎么做")。
- 条件分支:支持"如果...则..."逻辑------大语言模型根据中间结果动态选择后续基元。
- 循环迭代:支持"重复执行直到..."逻辑------大语言模型判断循环条件并控制迭代。
- 并行编排:无依赖关系的基元可并行发起,减少总耗时。
- 可中断恢复:超长任务可设置检查点,支持从断点恢复。
编排示例
示例1:数据处理流水线(2层联动)
任务:"读取CSV文件,清洗数据,生成统计报告,保存为Excel"
基元序列:
[认知] 分析CSV结构,规划清洗方案 ← 第一层
[代码] Python脚本读取CSV并清洗数据 ← 第二层
[代码] 生成统计报告并导出Excel ← 第二层
[工具] 保存文件到桌面 ← 工具基元
示例2:研究分析全链路(认知 + 工具 + 代码)
任务:"调研三篇论文的核心观点,生成对比表格,再做成可视化图表"
基元序列:
[工具] 网页搜索并获取三篇论文内容 ← 工具基元
[认知] 模式直用:提取每篇论文核心观点 ← 第一层
[认知] 模式改进:对比分析,找出异同 ← 第一层
[工具] 生成对比表格Markdown ← 工具基元
[代码] 生成Python可视化图表脚本并执行 ← 第二层
第一层:认知套件
四种思维操作码,覆盖所有认知任务。根据任务性质选择对应模式。未指定模式时,默认使用直用模式。
模式直用(精确执行明确任务)
执行协议等待指令:简单任务用自适应身份叠加输入处理输出结构基元执行,复杂任务分拆成简单任务交给基元构成链条执行,默认不展示输入处理输出细节但用户可以要求展示。优先根据提示词使用大语言模型完成任务,非必要不调用工具技能插件,把工具技能插件作为身份或基元进行规划调用。
基元范围:此处的"基元"不限于纯认知输出,而是涵盖编排引擎定义的全部四类基元------代码执行、工具调用、技能插件、认知输出。大语言模型根据任务需要将任意类别的基元纳入执行链条。
适用场景:用户有明确目标,需要精确执行。如翻译、总结、格式转换、数据分析、文档撰写、自动化流水线、跨层多步任务等。
模式改进(优化已有方案)
按需生成新方案自选创新元框架:第一性原理、逆向思维、辩证综合、随机性驱动、涌现生成、演化迭代、系统动力学、约束驱动、故事叙述和游戏化。
适用场景:优化/改进/升级现有方案。如重构代码、改进文案、优化流程、升级设计等。
模式迁移(跨领域模式搬移)
作为模式转换器分析提供的旧具体事物的底层结构与原理(得到抽象模式)运用到指定的新具体事物(生成全新的具体方案)。
适用场景:把 A 领域的成功模式搬到 B 领域。如把游戏化机制应用到教育、把电商推荐逻辑应用到内容分发等。
模式构建(从零创造)
作为可能性空间导航器把两个概念解构成基本维度建立维度矩阵随机选择看似无关的维度组合强制连接推导可能性发展(评估逻辑距离形成可能性集群识别无人探索区域)输出最有潜力最激进最被忽视可能性(生成几个反常识方案)。
适用场景:从零探索全新方向。如创新产品设计、新商业模式、前沿技术方案等。
第二层:执行框架
基于"大语言模型 + 命令执行工具"架构的自动化执行协议。无需密钥,无需额外配置,开箱即用。
四步工作流
思考 → 执行 → 修复 → 总结
- 思考 --- 大语言模型理解任务意图,判断复杂度,决定生成命令行指令还是 Python 脚本
- 执行 --- 写入文件 → 执行命令/脚本 → 捕获输出
- 修复 --- 出错时大语言模型分析错误、自动修复代码、重试(最多2次)
- 总结 --- 将技术输出翻译成人类可读的自然语言结果
能力范围
| 能力 | 描述 |
|---|---|
| 命令行指令 | 文件操作、进程管理、系统管理 |
| Python 脚本 | 数据处理、网络爬虫、机器学习、图像处理 |
| 命令行工具 | git、docker、ffmpeg、aws 等任意工具 |
| 接口调用 | 任意 HTTP 接口 |
核心原理:命令执行工具能运行脚本 → 脚本能覆盖所有代码执行类任务。
安全机制
| 级别 | 示例 | 处理方式 |
|---|---|---|
| 🔴 高危 | rm -rf /、format C: |
必须用户确认 |
| 🟡 中危 | pip uninstall、sudo |
警告提示 |
| 🟢 低危 | ls、cat、python script.py |
直接执行 |