[260531] OpenClaw 五月月报:模型接入大爆发、安全重构、手机端终于能当主控台用了 [特殊字符]

260531 OpenClaw 五月月报:模型接入大爆发、安全重构、手机端终于能当主控台用了 🦞

如果你想持续获取更多相关资讯,欢迎关注 x-cmd 博客

五月的 OpenClaw 更新密度创了今年新高,50 个版本砸下来,信息量有点大。我帮你筛了一遍,挑几件真正值得关注的事聊聊。

🤖 模型接入大爆发:Claude Opus 4.8、GitHub Copilot、NVIDIA 都来了

五月 OpenClaw 一口气接入了好几家新模型:Claude Opus 4.8 正式支持、GitHub Copilot 成为原生 Agent 运行时、Fal Krea 图像模型、NVIDIA 精选模型目录MiniMax 流式音乐生成Pixverse 视频生成。本地模型这边,Ollama 纯文本工具调用提升,DeepSeek reasoning_content 跨 tier 回放修复,DeepInfra 支持完整模型目录浏览。

划个重点:GitHub Copilot 作为 Agent 运行时这件事,意思是------如果你已经有 Copilot 订阅,可以不花额外 API 费用就能驱动 OpenClaw Agent。对学生和个人开发者来说,这省了一笔真金白银。

🔒 安全全线加固,服务器部署用户该留意

五月团队做了一次全路径安全审计,几乎每个攻击面都补了一遍:

  • 命令/权限层:原生命令所有者强制执行、Active Memory 管理员授权、Tavily 工具凭证隔离
  • 注入防护层 :群聊文本不混入系统提示词、memory_store 拒绝提示样式注入、浏览器 SSRF 检查
  • 边界加固层:带副作用命令拦截、危险 Node.js 覆盖拒绝、未认证 Tailscale 拒绝、设备令牌校验

如果你把 OpenClaw 部署在服务器上或通过频道给多人用,这波更新让安全性上了两个台阶。

📱 手机端终于不只是"查看器"了

iOS 和 Android 五月都经历了大改:

  • iOS Pro UI 全新设计:Command、Chat、Agents、Settings 四个独立标签页,能直接连 Gateway 会话、看诊断、实时语音
  • Android Talk Mode 迁移到 Gateway 中继语音会话,支持离线语音和断线恢复
  • 移动端配对:Android 新增配对网关,WebChat 支持重连自动投递未读消息

简单说,以前手机端基本就是个只读面板,现在你能在手机上发起命令、管理 Agent、参与实时语音对话了。重度用户终于可以真正"随时随地用"。

🎙️ 语音体系统一重构

语音这块五月做了件重要的事------把 Discord Voice、Google Meet、浏览器语音统一到一套共享 SDK 里,激活词匹配、咨询转录、输出检测这些通用能力不再各写一套。同时 Discord 语音支持多用户跟随和自动切换,Google Meet 加了本地打断检测。

📊 三个值得关注的长期趋势

聊完具体功能,说几个贯穿整个五月的信号:

OpenClaw 在往"Agent 操作系统"的方向走。 模型层覆盖了 Anthropic / OpenAI / Google / xAI / DeepSeek / NVIDIA / Copilot 等几乎所有主流供应商,频道层覆盖 Discord / Telegram / Slack / WhatsApp / iMessage / Signal / 飞书 / 企业微信等,设备层 macOS / Windows / Linux / iOS / Android / Docker 全平台。它不再只是"又一个 AI 聊天工具",而是 任何模型 × 任何频道 × 任何设备 的个人 AI 基础设施。

性能优化从打补丁变成了系统工程。 插件清单按需加载、核心方法懒加载、预计算补丁写入、不可变快照缓存------如果你五月升级后感觉启动更快、切换更流畅,这不是错觉,是实打实的工程投入。

插件生态开始平台化。 ClawHub 加了发现机制(显示名称、技能验证、信任标记)、分发机制(GitHub Copilot 和 Tokenjuice 外部化为官方按需安装插件)、治理机制(策略比较、合规检查)。团队在给第三方插件生态做制度性准备,不是玩票。

⚡ 其他值得扫一眼的更新

  • 📝 记录本统一:会议摘要、Codex 会话记录、WebChat 回复、命令行操作回放从此共享同一套记录路径,不再各管各的
  • 📄 加密 PDF 提取:ClawPDF 引擎支持加密 PDF,合同、报告这类加密文档终于能直接处理了
  • 🤖 Discord 实时思考过程:Agent 在 Discord 里能实时展示 thinking 过程,不用干等无反馈
  • 📊 Activity 面板上线:脱敏展示实时工具活动摘要,看 Agent 在做什么不用担心隐私泄露
  • 💬 Telegram 可靠性大幅提升:隔离轮询、假脱机、群媒体处理加固,从"能用"变"可靠"
  • 🧩 外部插件体系启动:Meeting Notes 插件作为首个源提供者外部插件发布,插件可以独立于核心包安装

五月总共发了 10 个稳定版 + 40 个预发布版,最密集的一天(5 月 29 日)发了 4 个 beta。v2026.5.28 稳定版预计 6 月初发布,会把 Claude Opus 4.8、GitHub Copilot 运行时、加密 PDF 这些 beta 功能带到稳定分支。

相关推荐
cup111 天前
[技术复盘] Windows Python 打包实战:Nuitka 环境踩坑总结与 CI 自动化构建全指南
python·ai·环境变量·ci·nuitka·skill
IT王师傅1 天前
从 豆包 到 Codex CLI:一名普通开发者的 AI 工具进化路线
ai·codex cli·openclaw
岳小哥AI1 天前
Siri要接入AI了,苹果手机上一句话让GPT写文案、DeepSeek写代码的时刻来了
ai·ai基础
Artech1 天前
[MAF预定义的AIContextProvider-03]ChatHistoryMemoryProvider——赋予Agent从经验中学习的能力
ai·c#·agent·memory·maf
哥布林学者2 天前
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力
机器学习·ai
Aphasia3112 天前
VPN 与内网穿透
安全
岳小哥AI2 天前
AI大模型"幻觉"从何而来?解密GPT-4、DeepSeek一本正经胡说八道的真相
ai·ai基础
JaguarJack3 天前
Openai Codex 重大更新 已支持接入任意开源大模型
ai·openai·codex
Mr_愚人派3 天前
当"Claude"不再是 Claude:一次第三方 API 代理引发的 AI 身份伪造排查实录
人工智能·安全
Artech3 天前
[MAF预定义的AIContextProvider-02]AgentSkillsProvider——将Agent Skills引入MAF
ai·c#·agent·agent skills·maf