万字解析 OpenClaw 源码架构-插件开发示例

OpenClaw 的插件体系由"插件清单 + 运行时注册 + 严格配置校验"构成。官方文档对插件发现顺序、加载路径、安全策略与缓存机制有明确规范；通道插件通过 api.registerChannel 注册消息适配器；工具插件通过 api.registerTool 注册可被代理调用的工具；集成插件则结合 HTTP 路由、生命周期钩子与服务管理实现深度集成。

graph TB subgraph "插件目录" VC["extensions/voice-call"] DC["extensions/discord"] TG["extensions/telegram"] LB["extensions/lobster"] LLM["extensions/llm-task"] MC["extensions/memory-core"] ML["extensions/memory-lancedb"] end subgraph "插件清单" VC_JSON["openclaw.plugin.json"] DC_JSON["openclaw.plugin.json"] TG_JSON["openclaw.plugin.json"] end VC --> VC_JSON DC --> DC_JSON TG --> TG_JSON subgraph "运行时" API["OpenClawPluginApi"] REG["registerChannel/registerTool/registerGatewayMethod"] end VC --> API DC --> API TG --> API LB --> API LLM --> API MC --> API ML --> API API --> REG

核心组件

插件清单与 JSON Schema：所有插件必须提供 openclaw.plugin.json，并内置 configSchema 用于严格配置校验，避免执行插件代码即可完成验证。
插件注册接口：通过 OpenClawPluginApi 提供的 registerChannel、registerTool、registerGatewayMethod、registerCli、registerService、registerHook 等能力，将功能注入到网关与代理运行时。
通道插件：负责消息出站/入站适配，统一对外暴露为"频道"，支持多账号、能力声明、安全策略与状态诊断。
工具插件：封装系统命令或外部 API，以类型化的参数与返回值形式供代理调用，支持沙箱与可选注册。
集成插件：结合 HTTP 路由、生命周期钩子与服务管理，实现第三方服务的深度集成与自动化。

架构总览

下图展示了插件在 OpenClaw 网关中的位置与交互方式：客户端通过 WebSocket 连接网关，网关根据插件注册的方法与工具进行消息路由与执行；通道插件负责具体消息渠道的收发；工具插件提供可被代理调用的能力；集成插件通过 HTTP 路由与钩子扩展系统行为。

sequenceDiagram participant Client as "客户端(WS)" participant Gateway as "网关" participant Plugin as "插件(通道/工具/集成)" participant Ext as "外部服务" Client->>Gateway : "连接/请求" Gateway->>Plugin : "调用已注册方法/工具" Plugin->>Ext : "HTTP/SDK/系统命令" Ext-->>Plugin : "响应/事件" Plugin-->>Gateway : "结果/事件" Gateway-->>Client : "响应/事件推送"

详细组件分析

消息适配器插件示例：Telegram 与 Discord

这两个插件属于"通道插件"，通过 api.registerChannel 将外部消息平台接入 OpenClaw 的统一消息面。它们的共同特征是：

在 openclaw.plugin.json 中声明 channels 字段，标识该插件注册了哪些频道。
在 index.ts 中导入通道实现与运行时设置函数，完成注册与钩子绑定。
通道插件通常包含配置解析、账户解析、能力声明、出站发送等适配器。

classDiagram class TelegramPlugin { +id : string +name : string +description : string +configSchema : object +register(api) } class DiscordPlugin { +id : string +name : string +description : string +configSchema : object +register(api) } class ChannelPlugin { +id : string +meta : object +capabilities : object +config : object +outbound : object +registerChannel() } TelegramPlugin --> ChannelPlugin : "注册" DiscordPlugin --> ChannelPlugin : "注册"

工具插件示例：Lobster 与 LLM Task

工具插件通过 api.registerTool 将可被代理调用的工具注册到运行时，支持沙箱环境下的可选注册与类型化参数校验。示例包括：

Lobster：提供可恢复审批的类型化工作流工具，支持沙箱条件下的选择性注册。
LLM Task：提供结构化任务的 JSON-only 工具，支持默认模型、鉴权配置与超时控制。

flowchart TD Start(["工具调用入口"]) --> CheckSandbox["检查沙箱环境"] CheckSandbox --> |允许| CreateTool["创建工具实例"] CheckSandbox --> |不允许| Deny["返回空(禁用)"] CreateTool --> Register["api.registerTool(...)"] Register --> End(["可用"]) Deny --> End

集成插件示例：Voice Call（消息适配器+工具+服务）

Voice Call 插件是"通道插件 + 工具插件 + 服务"的综合示例，展示了如何：

通过 openclaw.plugin.json 定义复杂的配置 Schema（含提供商、TTS/STT、隧道、流式通话等）。
在 index.ts 中注册多个网关方法（如 voicecall.initiate、voicecall.continue、voicecall.speak、voicecall.end、voicecall.status、voicecall.start），并通过工具接口提供统一的工具调用入口。
通过 api.registerService 管理生命周期（启动/停止），并在失败时记录日志。
通过 ensureRuntime 延迟初始化与错误重试控制，避免资源泄漏。

sequenceDiagram participant Client as "客户端" participant Gateway as "网关" participant VC as "Voice Call 插件" participant RT as "运行时/管理器" participant Provider as "提供商(Twilio/Telnyx)" Client->>Gateway : "voicecall.initiate" Gateway->>VC : "调用注册方法" VC->>RT : "ensureRuntime()" RT-->>VC : "返回运行时" VC->>Provider : "发起呼叫" Provider-->>VC : "返回结果" VC-->>Gateway : "响应{callId}" Gateway-->>Client : "确认"

集成插件示例：Memory Core 与 Memory (LanceDB)

这两个插件属于"内存/记忆"类插件，分别代表两类集成模式：

Memory Core：基于文件系统的轻量级搜索与 CLI 工具，通过 api.registerTool 注册 memory_search 与 memory_get，并提供 CLI 子命令。
Memory (LanceDB)：基于向量数据库的长期记忆，包含自动召回与自动捕获的生命周期钩子、CLI 命令、HTTP 路由与服务管理，同时具备提示注入防护与去重策略。

flowchart TD A["before_agent_start"] --> B["embed(prompt)"] B --> C["db.search(vector, limit)"] C --> D{"命中?"} D --> |是| E["prependContext 注入"] D --> |否| F["跳过"] subgraph "agent_end" G["提取用户消息文本"] --> H["shouldCapture 过滤"] H --> I{"可捕获?"} I --> |是| J["embed -> store"] I --> |否| K["跳过"] end

依赖关系分析

插件发现与加载：官方文档规定了从"配置路径 → 工作区扩展 → 全局扩展 → 内置扩展"的优先级顺序，且对路径安全性与缓存策略有明确要求。
清单与 Schema：每个插件必须提供 openclaw.plugin.json 与 configSchema，缺失或无效将导致验证失败。
运行时接口：插件通过 OpenClawPluginApi 的子路径导入（如 plugin-sdk/telegram、plugin-sdk/discord 等）获得特定平台的适配器与工具。

graph LR P["插件清单(openclaw.plugin.json)"] --> V["配置校验(JSON Schema)"] V --> R["运行时注册(register*)"] R --> G["网关/代理"]

性能考量

缓存与延迟初始化：Voice Call 插件通过 ensureRuntime 与运行时 Promise 缓存避免重复初始化；Memory (LanceDB) 插件采用惰性初始化与向量维度预计算降低冷启动成本。
资源释放：Voice Call 插件在服务停止时重置运行时引用，防止端口孤儿与内存泄漏。
I/O 与网络：通道插件与集成插件应限制并发、设置超时与重试策略，避免阻塞网关主循环。
日志与可观测性：通过 api.logger 输出关键事件与错误，便于定位性能瓶颈。

工具插件

OpenClaw 的插件体系由"插件 SDK + 多个具体插件"构成。插件以模块形式组织在 extensions 目录下，每个插件通常包含：

插件入口文件（index.ts）：定义插件注册逻辑、工具、命令、服务与生命周期钩子
配置文件（openclaw.plugin.json）：声明插件 ID、类型、UI 提示与配置模式
可选的内部模块（如通知、配置解析等）

graph TB subgraph "插件SDK" SDK["src/plugin-sdk/index.ts
导出插件API与类型"] TYPES["src/plugins/types.ts
插件类型与钩子定义"] end subgraph "内存工具插件" MEM_CORE["extensions/memory-core/index.ts"] MEM_LANCE["extensions/memory-lancedb/index.ts"] CFG["extensions/memory-lancedb/config.ts"] MEM_JSON["extensions/memory-lancedb/openclaw.plugin.json"] end subgraph "系统工具插件" DEV_PAIR["extensions/device-pair/index.ts"] DEV_NOTIFY["extensions/device-pair/notify.ts"] PHONE_CTRL["extensions/phone-control/index.ts"] VOICE_CALL["extensions/voice-call/index.ts"] DEV_JSON["extensions/device-pair/openclaw.plugin.json"] PHONE_JSON["extensions/phone-control/openclaw.plugin.json"] VOICE_JSON["extensions/voice-call/openclaw.plugin.json"] end SDK --> MEM_CORE SDK --> MEM_LANCE SDK --> DEV_PAIR SDK --> PHONE_CTRL SDK --> VOICE_CALL CFG --> MEM_LANCE MEM_JSON --> MEM_LANCE DEV_JSON --> DEV_PAIR PHONE_JSON --> PHONE_CTRL VOICE_JSON --> VOICE_CALL

核心组件

本节概述 OpenClaw 插件系统的关键能力与约定，为后续各插件实现提供统一参考。

插件 API（OpenClawPluginApi）
- 注册工具：registerTool
- 注册命令：registerCommand
- 注册网关方法：registerGatewayMethod
- 注册 CLI：registerCli
- 注册服务：registerService
- 生命周期钩子：on（支持 before_agent_start、agent_end、before_tool_call、after_tool_call 等）
- 路径解析：resolvePath
- 日志：logger
- 运行时访问：runtime（用于访问工具工厂、配置、状态目录等）
插件类型与钩子
- OpenClawPluginConfigSchema：支持 parse/safeParse/validate/uiHints/jsonSchema
- PluginHookName：定义可用的生命周期钩子名称集合
- PluginHookHandlerMap：按钩子名映射处理器签名
插件命令上下文（PluginCommandContext）
- 包含发送者标识、通道、授权状态、账户 ID、线程 ID 等
- 返回值为 ReplyPayload，统一消息格式
插件服务（OpenClawPluginService）
- 支持 start/stop 生命周期，常用于定时任务或后台守护

架构总览

OpenClaw 插件通过统一的 API 将"工具、命令、网关方法、CLI、服务与生命周期钩子"整合到运行时环境。下图展示了典型调用链路：

sequenceDiagram participant User as "用户/渠道" participant Cmd as "插件命令" participant API as "OpenClawPluginApi" participant Tools as "工具注册器" participant Runtime as "运行时" participant DB as "数据库/LanceDB" User->>Cmd : 触发命令 Cmd->>API : 解析参数/鉴权 API->>Runtime : 访问工具工厂/配置 API->>Tools : registerTool(...) Tools->>Runtime : 创建工具实例 Tools->>DB : 读写/查询 DB-->>Tools : 结果 Tools-->>API : 工具执行结果 API-->>Cmd : ReplyPayload Cmd-->>User : 回复

详细组件分析

内存工具插件（LanceDB）

该插件提供长短期记忆的向量检索与自动捕获/召回能力，核心特性：

向量嵌入：使用 OpenAI Embeddings 生成文本向量
存储：基于 LanceDB 的向量表，支持相似度搜索与去重
自动捕获：在会话结束时自动提取并存储重要信息
自动召回：在对话前注入相关记忆上下文
CLI 命令：ltm list/search/stats
工具：memory_recall/memory_store/memory_forget

classDiagram class MemoryDB { -db -table -initPromise +store(entry) +search(vector, limit, minScore) +delete(id) +count() } class Embeddings { -client +embed(text) } class MemoryPlugin { +register(api) +shouldCapture(text, options) +detectCategory(text) +formatRelevantMemoriesContext(memories) } MemoryPlugin --> MemoryDB : "使用" MemoryPlugin --> Embeddings : "使用"

sequenceDiagram participant Agent as "代理" participant API as "OpenClawPluginApi" participant Embed as "Embeddings" participant DB as "MemoryDB" participant Tools as "工具" Agent->>API : before_agent_start API->>Embed : embed(prompt) Embed-->>API : 向量 API->>DB : search(vector, limit, minScore) DB-->>API : 搜索结果 API-->>Agent : prependContext(记忆上下文) Agent->>API : agent_end API->>Tools : 提取用户消息 API->>Embed : embed(候选文本) API->>DB : search(vector, 1, 0.95) DB-->>API : 是否重复 API->>DB : store(新记忆) DB-->>API : 成功

参数验证与配置
- 使用 memoryConfigSchema 对插件配置进行解析与校验
- 支持环境变量占位符替换（如 ${OPENAI_API_KEY}）
- 默认数据库路径与模型维度映射
工具注册与执行
- registerTool 注册 memory_recall/memory_store/memory_forget
- 执行时进行参数校验、向量化、去重检查与结果序列化
CLI 与服务
- registerCli 注册 ltm 子命令
- registerService 启停日志输出

设备配对工具插件

该插件用于生成配对码、批准设备请求，并支持 Telegram 通知订阅与一次性提醒。

关键流程
- 生成配对码：编码网关 URL、认证方式与令牌
- 批准请求：approveDevicePairing 并返回批准结果
- 通知：Telegram 订阅与轮询推送新请求
- URL 解析：优先 publicUrl，其次 Tailscale Serve/Funnel，再回退到本地绑定

sequenceDiagram participant User as "用户" participant Cmd as "命令处理器" participant Pair as "设备配对" participant Notify as "通知服务" participant Gate as "网关URL解析" User->>Cmd : /pair Cmd->>Gate : 解析网关URL Gate-->>Cmd : URL/错误 Cmd->>Pair : 生成配对码 Pair-->>Cmd : 配对码/说明 Cmd-->>User : 发送配对码/二维码 Notify->>Pair : 轮询待批准列表 Notify-->>User : 推送新请求提醒

参数与鉴权解析
- 支持 token/password 两种模式，优先从环境变量与配置中解析
- URL 正规化与端口选择策略
命令与通知
- /pair status/pending/approve/qr/notify
- 一次性订阅与持久订阅模式

电话控制工具插件

该插件用于临时允许高风险节点命令（相机、屏幕录制、写操作），并支持自动过期与状态持久化。

核心能力
- 状态文件：armed.json，记录允许/拒绝命令集与过期时间
- 允许/拒绝列表更新：动态修改配置并写回
- 定时服务：定期检查过期并自动解除武装
- 命令：/phone status/arm/disarm/help

flowchart TD Start(["进入 /phone 命令"]) --> Parse["解析动作与参数"] Parse --> Action{"动作类型"} Action --> |status| ReadState["读取状态文件"] ReadState --> ReplyStatus["回复当前状态"] Action --> |arm| UpdateAllow["计算允许/拒绝命令集"] UpdateAllow --> WriteState["写入状态文件"] WriteState --> WriteCfg["写回配置"] WriteCfg --> ReplyArm["回复已临时允许的命令"] Action --> |disarm| Disarm["恢复允许/拒绝列表"] Disarm --> ClearState["清空状态文件"] ClearState --> ReplyDisarm["回复已解除武装"] Action --> |help| ReplyHelp["回复帮助信息"]

状态持久化与版本兼容
- 支持 v1/v2 状态文件格式，自动迁移字段
- 文件原子写入，异常时保留原状
自动过期
- 定时服务每 15 秒检查一次，过期后自动解除武装

语音通话工具插件

该插件提供电话呼入呼出能力，支持 Telnyx/Twilio/Plivo 等提供商，并可选实时流式 TTS/STT。

网关方法
- voicecall.initiate/continue/speak/end/status/start
- 统一响应格式：success/error + 附加数据
工具与 CLI
- registerTool 提供 voice_call 工具
- registerCli 提供 voicecall 子命令
配置与校验
- 支持多种提供商配置与敏感字段 UI 提示
- 提供解析与校验函数，确保必要字段存在

sequenceDiagram participant User as "用户" participant Tool as "voice_call 工具" participant API as "OpenClawPluginApi" participant RT as "VoiceCallRuntime" participant Provider as "提供商(如 Twilio)" User->>Tool : 调用 action Tool->>API : ensureRuntime() API->>RT : 创建/获取运行时 Tool->>RT : manager.initiateCall/continue/speak/end RT->>Provider : 发起/继续/播放/结束通话 Provider-->>RT : 结果 RT-->>Tool : 结果 Tool-->>User : JSON 响应

内存核心工具插件

该插件通过运行时工具工厂创建内存搜索与获取工具，并注册 CLI。

工具工厂
- createMemorySearchTool / createMemoryGetTool
- 若工厂不可用则返回空
CLI
- registerMemoryCli 注册 memory 子命令

依赖关系分析

插件 SDK 与类型
- 所有插件均依赖 OpenClawPluginApi 与插件类型定义
- 生命周期钩子与工具签名在 types.ts 中集中定义
插件间耦合
- 内存插件依赖 LanceDB 与 OpenAI
- 设备配对插件依赖网关绑定与 Tailscale
- 电话控制插件依赖配置文件系统与定时服务
- 语音通话插件依赖提供商 SDK 与实时流式能力

graph LR SDK["插件SDK(types.ts)"] --> MEM["内存插件(LanceDB)"] SDK --> DEV["设备配对"] SDK --> PHONE["电话控制"] SDK --> CALL["语音通话"] MEM --> LANCEDB["@lancedb/lancedb"] MEM --> OPENAI["OpenAI Embeddings"] DEV --> BIND["网关绑定/Tailscale"] PHONE --> CFG["配置文件系统"] CALL --> PROVIDER["提供商SDK/实时流"]

性能考虑

向量搜索与相似度转换
- LanceDB 默认使用 L2 距离，插件将其映射到 0-1 相似度范围，避免额外开销
- 限制返回数量与最小分数阈值，减少序列化与传输成本
异步初始化与懒加载
- MemoryDB 与 Embeddings 采用延迟初始化，首次使用时才加载模块与连接数据库
- 语音通话插件运行时采用 Promise 缓存，失败后重置以便下次重试
状态持久化与原子写入
- phone-control 使用原子写入与目录创建，避免部分写入导致的状态损坏
- 内存插件对向量数组进行剥离，防止无法克隆的数据结构造成序列化问题
定时任务与资源释放
- 设备配对通知服务与电话控制定时器在 stop 时清理，避免资源泄漏

认证插件

认证插件位于 extensions 目录下，每个插件由"入口文件 + 认证流程实现 + 插件清单 + 可选测试"组成；同时，命令层负责调用插件、写入凭据与配置补丁。

graph TB subgraph "插件层" GG["google-gemini-cli-auth
入口与OAuth实现"] MM["minimax-portal-auth
入口与OAuth实现"] QW["qwen-portal-auth
入口与OAuth实现"] end subgraph "SDK与命令层" SDK_MM["plugin-sdk/minimax-portal-auth.ts"] SDK_QW["plugin-sdk/qwen-portal-auth.ts"] CMD_AUTH["commands/models/auth.ts"] APPLY["commands/auth-choice.apply.plugin-provider.ts"] end subgraph "文档与配置" DOC_OAUTH["docs/concepts/oauth.md"] DOC_AUTH["docs/gateway/authentication.md"] DOC_MM["docs/providers/minimax.md"] DOC_QW["docs/providers/qwen.md"] end GG --> CMD_AUTH MM --> CMD_AUTH QW --> CMD_AUTH CMD_AUTH --> APPLY SDK_MM --> MM SDK_QW --> QW CMD_AUTH --> DOC_OAUTH CMD_AUTH --> DOC_AUTH DOC_MM --> MM DOC_QW --> QW

核心组件

插件入口：注册 Provider、声明认证方法（kind）、运行时上下文（openUrl、prompter、note、progress）。
OAuth 实现：封装 PKCE、授权端点、令牌交换、用户信息与项目发现、轮询等待与错误处理。
配置补丁：动态注入默认模型、基础 URL、API 类型、成本与上下文窗口等。
命令集成：通过 CLI 触发插件认证，写入 auth-profiles.json 并合并 models.json。

架构总览

认证插件遵循"插件定义 → 命令触发 → SDK 调用 → OAuth 执行 → 凭据落盘"的闭环。

sequenceDiagram participant U as "用户" participant CLI as "命令行(models/auth)" participant API as "插件API(ProviderAuthContext)" participant SDK as "插件SDK(minimax/qwen)" participant AUTH as "OAuth实现(google-gemini-cli/minimax/qwen)" participant STORE as "凭据存储(auth-profiles.json)" U->>CLI : 运行认证命令 CLI->>API : 解析Provider与Method API->>SDK : 调用认证方法(run) SDK->>AUTH : 执行OAuth流程(PKCE/轮询/回调) AUTH-->>SDK : 返回访问令牌/刷新令牌/过期时间/项目ID SDK-->>API : 构建ProviderAuthResult(含configPatch) API->>STORE : 写入凭据与配置补丁 STORE-->>CLI : 完成并提示

详细组件分析

Google Gemini CLI 认证插件

功能要点
- 支持 PKCE + 本地回调（localhost:8085），自动或手动模式切换。
- 从环境变量或已安装的 Gemini CLI 提取 OAuth 客户端凭据。
- 令牌交换后获取邮箱与项目 ID，必要时通过多端点探测与引导完成项目发现。
- 将结果包装为 ProviderAuthResult，包含默认模型、访问/刷新令牌、过期时间与额外字段。
关键流程（远程/WSL2 同步场景）
- 自动打开浏览器并在本地监听回调；若端口占用则回退到手动粘贴回调 URL。
- 多端点探测 loadCodeAssist，兼容 VPC-SC 场景，必要时引导设置 GOOGLE_CLOUD_PROJECT。
错误处理
- 状态不匹配、超时、端口占用、缺少刷新令牌、项目发现失败等均抛出明确错误并提示。

sequenceDiagram participant P as "插件入口(index.ts)" participant C as "ProviderAuthContext" participant O as "OAuth(loginGeminiCliOAuth)" participant G as "Google OAuth端点" participant U as "用户浏览器" P->>C : 注册Provider与OAuth方法 C->>O : 调用run() O->>U : 打开授权URL(PKCE) alt 本地回调可用 U-->>O : 回调至localhost : 8085 else 端口不可用/远程 O->>C : 提示手动粘贴回调URL C-->>O : 用户粘贴回调 end O->>G : 交换授权码为令牌 G-->>O : 返回access/refresh/expires O->>G : 获取用户邮箱与项目ID O-->>P : 返回ProviderAuthResult

MiniMax 门户认证插件

功能要点
- 设备码登录（device_code），支持 CN 与 Global 区域端点。
- 轮询令牌状态，动态调整轮询间隔，超时/错误时给出明确提示。
- 返回 access/refresh/expires 与可选资源 URL，构建 ProviderAuthResult 并合并 models.json。
关键流程
- 申请设备码与用户码，打开验证页，轮询换取令牌，成功后返回并写入配置补丁。

sequenceDiagram participant P as "插件入口(index.ts)" participant C as "ProviderAuthContext" participant O as "OAuth(loginMiniMaxPortalOAuth)" participant M as "MiniMax OAuth端点" participant U as "用户浏览器" P->>C : 注册Provider与OAuth方法 C->>O : 调用run() O->>M : 申请设备码(PKCE) M-->>O : 返回user_code/verification_uri/过期时间 O->>U : 打开验证页并提示输入user_code loop 轮询 O->>M : 以device_code换取令牌 alt pending/slow_down O->>O : 延长轮询间隔 else success M-->>O : 返回access/refresh/expires/resourceUrl O-->>P : 返回ProviderAuthResult else error O-->>P : 抛出错误 end end

Qwen 门户认证插件

功能要点
- 设备码登录（device_code），支持 PKCE。
- 轮询等待授权，支持 slow_down 情况下的指数退避。
- 返回 access/refresh/expires 与可选资源 URL，合并默认模型与别名。
关键流程
- 申请设备码，打开验证页，轮询换取令牌，成功后写入配置补丁。

sequenceDiagram participant P as "插件入口(index.ts)" participant C as "ProviderAuthContext" participant O as "OAuth(loginQwenPortalOAuth)" participant Q as "Qwen OAuth端点" participant U as "用户浏览器" P->>C : 注册Provider与OAuth方法 C->>O : 调用run() O->>Q : 申请设备码(PKCE) Q-->>O : 返回device_code/user_code/verification_uri/过期时间 O->>U : 打开验证页并提示输入user_code loop 轮询 O->>Q : 以device_code换取令牌 alt authorization_pending O->>O : 维持轮询 else slow_down O->>O : 增大轮询间隔 else success Q-->>O : 返回access/refresh/expires/resourceUrl O-->>P : 返回ProviderAuthResult else error O-->>P : 抛出错误 end end

插件 SDK 与命令集成

SDK 暴露
- minimax-portal-auth：导出空配置模式、构建 OAuth 结果、PKCE 工具与表单编码工具。
- qwen-portal-auth：导出空配置模式、构建 OAuth 结果、PKCE 工具与表单编码工具。
命令层
- 解析 Provider 与 Method，创建 VPS/远程适配的 OAuth 处理器，执行 run 并写入凭据。
- 应用插件 Provider 的认证选择，启用插件、解析 Provider、选择方法并执行。

依赖关系分析

插件对 SDK 的依赖：仅使用 SDK 暴露的最小接口（空配置、PKCE、表单编码、结果构建）。
插件对命令层的依赖：通过 ProviderAuthContext 注入 openUrl、note、progress、prompt 等能力。
文档与配置：凭据存储位置、多账户路由、刷新与过期策略、API Key 旋转行为等。

graph LR IDX_GG["google-gemini-cli-auth/index.ts"] --> OAUTH_GG["google-gemini-cli-auth/oauth.ts"] IDX_MM["minimax-portal-auth/index.ts"] --> OAUTH_MM["minimax-portal-auth/oauth.ts"] IDX_QW["qwen-portal-auth/index.ts"] --> OAUTH_QW["qwen-portal-auth/oauth.ts"] SDK_MM["plugin-sdk/minimax-portal-auth.ts"] --> IDX_MM SDK_QW["plugin-sdk/qwen-portal-auth.ts"] --> IDX_QW CMD["commands/models/auth.ts"] --> IDX_GG CMD --> IDX_MM CMD --> IDX_QW DOC_OAUTH["docs/concepts/oauth.md"] --> CMD DOC_AUTH["docs/gateway/authentication.md"] --> CMD

性能与可靠性

轮询策略
- MiniMax 与 Qwen 的轮询采用指数退避与最大上限控制，避免频繁请求。
端点容错
- Gemini CLI 的项目发现尝试多个端点，兼容不同环境与异常情况。
超时与重试
- 明确的超时阈值与错误提示，便于用户快速定位问题。
存储与并发
- 凭据写入采用原子更新与文件锁，避免并发冲突。

消息渠道插件

OpenClaw 将每个消息渠道封装为独立的扩展目录，遵循统一的组织规范：

扩展根目录：extensions/{channel}
插件清单：openclaw.plugin.json（定义插件标识、支持的通道类型、配置模式）
入口文件：index.ts（负责注册插件、注入运行时、导出通道插件）

graph TB subgraph "扩展目录" D["extensions/discord"] T["extensions/telegram"] S["extensions/slack"] W["extensions/whatsapp"] end D --> D_idx["index.ts"] D --> D_cfg["openclaw.plugin.json"] T --> T_idx["index.ts"] T --> T_cfg["openclaw.plugin.json"] S --> S_idx["index.ts"] S --> S_cfg["openclaw.plugin.json"] W --> W_idx["index.ts"] W --> W_cfg["openclaw.plugin.json"]

核心组件

插件清单（openclaw.plugin.json）：声明插件 id、支持的通道数组、配置模式（JSON Schema）。用于向系统注册该插件可处理的消息通道类型。
插件入口（index.ts）：定义插件对象，包含 id、name、description、configSchema，以及 register 回调。register 中完成运行时注入与通道插件注册。
通道插件（由各扩展的 src/channel.js 导出）：实现具体的消息收发逻辑，供插件入口通过 api.registerChannel 注册使用。
运行时注入（runtime）：通过各扩展的 runtime 文件设置运行时环境，确保通道插件在正确的上下文中执行。

架构总览

下图展示了从插件入口到通道插件与运行时的整体交互关系：

graph LR A["OpenClaw 核心"] --> B["插件入口 index.ts"] B --> C["注册通道插件
api.registerChannel"] B --> D["注入运行时
set*Runtime(api.runtime)"] C --> E["通道插件
src/channel.js"] D --> E

详细组件分析

Discord 插件

插件清单：声明 id 为 discord，支持通道类型为 ["discord"]，配置模式为空对象。
插件入口：注册插件后，设置 Discord 运行时，注册 Discord 通道插件，并注册子代理钩子。
通道插件：由扩展目录下的 src/channel.js 提供，作为 ChannelPlugin 注入到核心。
运行时注入：setDiscordRuntime(api.runtime) 将运行时注入到通道插件中。

sequenceDiagram participant Core as "OpenClaw 核心" participant Plugin as "Discord 插件入口" participant Runtime as "Discord 运行时" participant Channel as "Discord 通道插件" Core->>Plugin : 调用 register(api) Plugin->>Runtime : setDiscordRuntime(api.runtime) Plugin->>Core : api.registerChannel({ plugin : Channel }) Plugin->>Core : registerDiscordSubagentHooks(api) Core-->>Channel : 在运行时上下文中执行

Telegram 插件

插件清单：声明 id 为 telegram，支持通道类型为 ["telegram"]，配置模式为空对象。
插件入口：注册插件后，设置 Telegram 运行时，注册 Telegram 通道插件。
通道插件：由扩展目录下的 src/channel.js 提供，作为 ChannelPlugin 注入到核心。

sequenceDiagram participant Core as "OpenClaw 核心" participant Plugin as "Telegram 插件入口" participant Runtime as "Telegram 运行时" participant Channel as "Telegram 通道插件" Core->>Plugin : 调用 register(api) Plugin->>Runtime : setTelegramRuntime(api.runtime) Plugin->>Core : api.registerChannel({ plugin : Channel }) Core-->>Channel : 在运行时上下文中执行

Slack 插件

插件清单：声明 id 为 slack，支持通道类型为 ["slack"]，配置模式为空对象。
插件入口：注册插件后，设置 Slack 运行时，注册 Slack 通道插件。
通道插件：由扩展目录下的 src/channel.js 提供，作为 ChannelPlugin 注入到核心。

sequenceDiagram participant Core as "OpenClaw 核心" participant Plugin as "Slack 插件入口" participant Runtime as "Slack 运行时" participant Channel as "Slack 通道插件" Core->>Plugin : 调用 register(api) Plugin->>Runtime : setSlackRuntime(api.runtime) Plugin->>Core : api.registerChannel({ plugin : Channel }) Core-->>Channel : 在运行时上下文中执行

WhatsApp 插件

插件清单：声明 id 为 whatsapp，支持通道类型为 ["whatsapp"]，配置模式为空对象。
插件入口：注册插件后，设置 WhatsApp 运行时，注册 WhatsApp 通道插件。
通道插件：由扩展目录下的 src/channel.js 提供，作为 ChannelPlugin 注入到核心。

sequenceDiagram participant Core as "OpenClaw 核心" participant Plugin as "WhatsApp 插件入口" participant Runtime as "WhatsApp 运行时" participant Channel as "WhatsApp 通道插件" Core->>Plugin : 调用 register(api) Plugin->>Runtime : setWhatsAppRuntime(api.runtime) Plugin->>Core : api.registerChannel({ plugin : Channel }) Core-->>Channel : 在运行时上下文中执行

依赖关系分析

插件入口依赖 SDK 类型与空配置模式生成器，确保插件对象满足核心要求。
插件入口通过 api.registerChannel 注册通道插件，形成"入口 → 通道插件"的直接依赖。
插件入口通过 set*Runtime 注入运行时，形成"入口 → 运行时"的依赖链。
插件清单 openclaw.plugin.json 决定插件的通道能力与配置约束，是系统识别与加载的关键。

graph TB IDX["index.ts"] --> REG["api.registerChannel"] IDX --> RUNTIME["set*Runtime"] REG --> CH["通道插件"] RUNTIME --> CH CFG["openclaw.plugin.json"] --> IDX CFG --> REG

性能考虑

运行时注入：通过 set*Runtime 将运行时注入通道插件，避免重复初始化，提升启动与执行效率。
空配置模式：使用 emptyPluginConfigSchema 可减少不必要的配置校验开销，适合无需复杂参数的轻量插件。
通道注册：仅在 register 中进行一次 api.registerChannel，避免重复注册导致的资源浪费。
错误隔离：在通道插件内部对网络请求与第三方 API 调用进行超时与重试控制，降低失败对整体系统的冲击。

专用插件

OpenClaw 插件体系采用"扩展包"组织方式，每个插件位于独立目录下，包含：

扩展包根目录：如 voice-call、bluebubbles、acpx、diagnostics-otel、talk-voice 等
插件清单：openclaw.plugin.json，定义插件标识、UI 提示、配置模式与能力声明
入口与实现：index.ts（部分插件）或具体模块（如 voice-call 的多提供商适配）
技能目录：如 acpx/skills，用于承载与插件绑定的技能资源
文档与使用说明：各插件目录下的 README.md 或 SKILL.md

graph TB subgraph "插件扩展包" VC["语音通话插件
extensions/voice-call"] BB["BlueBubbles 插件
extensions/bluebubbles"] ACX["ACPX 插件
extensions/acpx"] DIO["诊断监控插件
extensions/diagnostics-otel"] TV["Talk 语音管理插件
extensions/talk-voice"] end subgraph "配置与清单" OPL1["voice-call/openclaw.plugin.json"] OPL2["bluebubbles/openclaw.plugin.json"] OPL3["acpx/openclaw.plugin.json"] OPL4["diagnostics-otel/openclaw.plugin.json"] OPL5["talk-voice/openclaw.plugin.json"] end VC --- OPL1 BB --- OPL2 ACX --- OPL3 DIO --- OPL4 TV --- OPL5

核心组件

语音通话插件：支持 Twilio、Telnyx、Plivo 多提供商，具备外呼/通知模式、媒体流、实时 STT/TTS、签名验证与去重保护、超时与清理策略等。
BlueBubbles 插件：作为外部通道插件，负责健康检查、消息发送、反应/打字指示、附件下载、Webhook 路由与运行时桥接。
ACPX 插件：提供 ACP 运行时后端，支持命令路径、版本策略、权限模式、非交互权限策略、队列所有权 TTL、MCP 服务器注入等。
诊断监控插件：基于 OTel 的诊断能力，提供可观测性与指标采集。
Talk 语音管理插件：提供 Talk 设备语音选择与管理能力。
文本生成插件（技能）：通过技能目录与工具链实现文本生成任务，与插件生态协同工作。

架构总览

OpenClaw 插件通过统一的插件清单与运行时桥接，将第三方服务与本地能力整合到统一的消息与工具调用管道中。语音通话与 BlueBubbles 插件分别对接外部通道与提供商，ACPX 插件提供会话与权限控制，诊断插件提供可观测性，Talk 语音插件提供设备侧语音管理。

详细组件分析

语音通话插件（Voice Call）

功能要点
- 多提供商适配：Twilio、Telnyx、Plivo、Mock（本地开发）
- 外呼模式：通知式（notify）与对话式（conversation）
- 媒体流与实时 STT/TTS：支持 WebSocket 流、OpenAI Realtime API、提供商原生语音
- 安全与稳定性：Webhook 签名验证、去重保护、静音/转写超时、挂断延迟、呼叫清理器
- 配置覆盖：支持深合并覆盖核心 TTS 配置
关键配置项（节选）
- provider、fromNumber、toNumber、inboundPolicy、allowFrom、inboundGreeting
- serve/port/path、tailscale、tunnel、webhookSecurity
- outbound/defaultMode、notifyHangupDelaySec、maxDurationSeconds、staleCallReaperSeconds
- streaming/enabled、sttProvider、openaiApiKey、sttModel、streamPath、预连接与并发限制
- tts/provider、openai/elevenlabs 参数、edge（通话场景禁用）
- store、responseModel、responseSystemPrompt、responseTimeoutMs
使用与工具
- CLI：openclaw voicecall call/continue/speak/end/status/tail/expose
- 工具：voice_call.initiate_call/continue_call/speak_to_user/end_call/get_status
- RPC：voicecall.initiate/continue/speak/end/status

sequenceDiagram participant U as "用户" participant CLI as "CLI/工具" participant VC as "语音通话插件" participant Prov as "提供商(如 Twilio)" participant RT as "实时流/STT/TTS" U->>CLI : 发起外呼/继续/播报 CLI->>VC : voice_call.initiate_call/continue_call/speak_to_user VC->>Prov : 创建/控制通话(外呼/媒体流) Prov-->>VC : Webhook(状态/事件) VC->>RT : 启动/维护媒体流(可选) RT-->>VC : 实时转写/合成音频 VC-->>CLI : 返回状态/结果 CLI-->>U : 展示/播报

BlueBubbles 集成插件（External Channel）

功能要点
- 外部通道插件：负责 BlueBubbles 服务的健康检查、消息发送、反应/打字指示、附件下载
- Webhook 处理：注册插件 HTTP 路由，规范化发送方/聊天 ID，跳过自发消息，路由至核心回复管线
- 运行时桥接：通过 api.runtime 与 openclaw/plugin-sdk 辅助函数集成
内部助手（推荐使用）
- probeBlueBubbles、sendMessageBlueBubbles、resolveChatGuidForTarget
- sendBlueBubblesReaction、sendBlueBubblesTyping/markBlueBubblesChatRead
- downloadBlueBubblesAttachment、buildBlueBubblesApiUrl/blueBubblesFetchWithTimeout
配置（核心）
- channels.bluebubbles.serverUrl、password、webhookPath
- 行为限制：channels.bluebubbles.actions.reactions（默认开启）

flowchart TD Start(["收到 BlueBubbles Webhook"]) --> Normalize["规范化发送方/聊天标识"] Normalize --> SelfCheck{"是否来自自身?"} SelfCheck --> |是| Drop["丢弃该消息"] SelfCheck --> |否| Attachments{"是否有附件/贴图?"} Attachments --> |是| Placeholder["文本为空时使用占位符"] Attachments --> |否| Route["路由到核心回复管线"] Placeholder --> Route Route --> Done(["完成"]) Drop --> Done

ACPX 协议插件（ACPX Runtime）

功能要点
- ACP 运行时后端，支持命令路径、版本策略、工作目录、权限模式（approve-all/read-only/deny-all）
- 非交互权限策略（deny/fail），严格 Windows cmd 包装器开关
- 提示超时与队列拥有者 TTL，MCP 服务器注入（command/args/env）
关键配置项（节选）
- command、expectedVersion、cwd、permissionMode、nonInteractivePermissions
- strictWindowsCmdWrapper、timeoutSeconds、queueOwnerTtlSeconds
- mcpServers（命名 MCP 服务器定义）

classDiagram class ACPXPlugin { +命令路径 +期望版本 +工作目录 +权限模式 +非交互权限策略 +严格Windows包装器 +提示超时 +队列拥有者TTL +MCP服务器列表 } class MCP_Server { +命令 +参数数组 +环境变量 } ACPXPlugin --> MCP_Server : "注入"

诊断监控插件（Diagnostics OTel）

功能要点
- 基于 OpenTelemetry 的诊断能力，提供可观测性与指标采集
- 插件清单最小化，便于在不同环境中启用/停用
配置
- 当前无额外配置项，保持开箱即用

Talk 语音管理插件（Talk Voice）

功能要点
- 管理 Talk 设备的语音选择与设置
- 插件清单简洁，提供列出/设置能力
配置
- 当前无额外配置项

文本生成插件（以技能形式体现）

功能要点
- 通过技能目录与工具链实现文本生成任务
- 与插件生态协同，提供可复用的生成能力
说明
- 本节为概念性说明，不直接分析具体源码文件

依赖关系分析

语音通话插件对提供商的依赖：Twilio/Telnyx/Plivo/Mock；对实时流服务（如 OpenAI Realtime）的依赖
BlueBubbles 插件对 BlueBubbles 服务的 REST/Webhook 依赖
ACPX 插件对本地命令与 MCP 服务器的依赖
诊断插件对 OTel 生态的依赖
Talk 语音插件对设备侧语音能力的依赖

graph LR VC["语音通话插件"] --> TW["Twilio"] VC --> TL["Telnyx"] VC --> PV["Plivo"] VC --> MK["Mock"] VC --> OR["OpenAI Realtime"] BB["BlueBubbles 插件"] --> BB_API["BlueBubbles 服务"] ACX["ACPX 插件"] --> CMD["本地命令/脚本"] ACX --> MCP["MCP 服务器"] DIO["诊断监控插件"] --> OT["OTel 生态"] TV["Talk 语音管理插件"] --> DEV["设备语音"]

性能考量

语音通话
- 媒体流并发与预连接上限需结合硬件与网络带宽设定，避免拥塞与抖动
- 实时 STT/TTS 的超时与静音阈值应平衡响应速度与准确性
- 呼叫清理器时间窗应高于最大通话时长，防止误杀正常通话
BlueBubbles
- Webhook 路由与附件下载应异步化，避免阻塞主消息管线
- 健康检查与重试策略需考虑服务可用性与速率限制
ACPX
- 队列拥有者 TTL 应尽量短，减少轮询与延迟
- 权限模式与非交互策略影响执行效率与安全性
诊断与监控
- 指标采样频率与上报间隔需权衡精度与资源占用
Talk 语音
- 设备语音切换应避免阻塞主线程，必要时采用后台线程