Transformer论文作者重造龙虾,Rust搓出钢铁版,告别OpenClaw裸奔漏洞

有多少龙虾在互联网上裸奔?

AI 智能体带着你的密码和 API 密钥暴露给全网。

Transformer 作者 Illia Polosukhin 看不下去了。出手从零重构了安全版龙虾:IronClaw。

|------|--------------|---------------|
| 功能 | OpenClaw | IronClaw |
| 核心语言 | TypeScript | Rust |
| 凭证处理 | 直接暴露给 AI 智能体 | 加密存储,LLM 无法访问 |
| 工具执行 | 在主环境中运行 | WASM 沙箱隔离运行 |
| 部署环境 | 标准服务器 | 可信执行环境(TEE) |
| 数据隐私 | 存在泄露风险 | 本地加密,无遥测数据 |

IronClaw 目前已在 GitHub 上开源,提供 macOS、Linux 和 Windows 的安装包,支持本地部署,也支持通过云端托管。项目仍处于快速迭代阶段,v0.15.0 版本的二进制文件已可下载。

Polosukhin(以下简称菠萝哥)还在 Reddit 论坛开贴回应一切,关注度颇高。

OpenClaw 火了,但也 "着火" 了

菠萝哥本人也是 OpenClaw 的早期使用者,并称这是他等了 20 年的技术。

它已经改变了我与计算交互的方式。

然而 OpenClaw 的安全状况堪称灾难,一键式远程代码执行、提示注入攻击、恶意技能窃取密码,这些漏洞在 OpenClaw 的生态系统中被逐一曝光。

超过 25000 个公开实例在没有充分安全控制的情况下暴露在互联网上,被安全专家直接称为「安全垃圾火灾(security dumpster fire)」。

问题的根源在于架构本身。

当用户将自己的邮箱 Bearer Token 交给 OpenClaw 时,会被直接送入 LLM 提供商的服务器。

菠萝哥在 Reddit 上指出这意味着什么:

你所有的信息,甚至包括你没有明确授权的数据,都可能被该公司的任何员工访问到。这同样适用于你雇主的数据。不是说这些公司有恶意,但现实就是用户没有真正的隐私。

他表示,再多的便利也不值得拿自己和家人的安全与隐私去冒险。

用 Rust 从零重建一切

IronClaw 是用 Rust 语言对 OpenClaw 的完全重写。

Rust 的内存安全特性能从根本上消除缓冲区溢出等传统漏洞,这对于需要处理私钥和用户凭证的系统至关重要。

在安全架构上,IronClaw 建立了四层纵深防御。

第一层是 Rust 本身提供的内存安全保证。

第二层是 WASM 沙箱隔离,所有第三方工具和 AI 生成的代码都在独立的 WebAssembly 容器中运行,即使某个工具是恶意的,其破坏范围也被严格限制在沙箱之内。

第三层是加密凭证保险库,所有 API 密钥和密码都使用 AES-256-GCM 加密存储,每一条凭证都绑定了策略规则,规定它只能用于特定域名。

第四层是可信执行环境(TEE),利用硬件级别的隔离保护数据,即使是云服务提供商也无法访问用户的敏感信息。

这套设计中最关键的一点是:大模型本身永远接触不到原始凭证。

只有当智能体需要与外部服务通信时,凭证才会在网络边界被注入。

菠萝哥举了一个例子,即使大模型被提示注入攻击,试图将用户的 Google OAuth 令牌发送给攻击者,凭证存储层也会直接拒绝这个请求,记录日志,并向用户发出警报。

然而开发者社区还是不放心,毕竟 OpenClaw 有 2000 多个公开实例被攻击,以及存在大量恶意技能,IronClaw 一旦走红会不会重蹈覆辙?

菠萝哥的回应是,IronClaw 的架构设计已经从根本上堵住了 OpenClaw 的核心漏洞。凭证始终加密存储且从不接触 LLM,第三方技能无法在主机上执行脚本,只能在容器内部运行。

即便通过 CLI 访问,也需要用户的系统钥匙串来解密,拿到的加密密钥本身没有意义。

他同时表示,随着核心版本趋于稳定,团队计划进行红队测试和专业安全审查。

关于提示注入这个业界公认的难题,菠萝哥给出了更详细的思路。

当前 IronClaw 使用启发式规则进行模式检测,未来目标是部署一个可持续更新的小型语言分类器来识别注入模式。

但他也承认,提示注入不仅可能窃取凭证,还可能直接篡改用户的代码库或通过通讯工具发送恶意消息。

应对这类攻击需要一套更智能的策略系统,能够在不查看输入内容的情况下审查智能体的行为意图,"还需要更多工作,欢迎社区贡献"。

有人问到本地部署和云端部署的取舍。

菠萝哥认为纯本地方案存在明显局限,设备关机时智能体就停止工作,移动端的能耗难以承受,复杂的长时间任务也无法运行。

他认为机密云(confidential cloud)是目前的最优折中方案,既能提供接近本地设备的隐私保障,又能解决「永远在线」的问题。

他还提到一个细节:用户可以设置策略,例如在跨境旅行时自动添加额外的安全屏障,防止未经授权的访问。

一个更大的野心

菠萝哥并非普通的开源开发者。

2017 年,他作为八位共同作者之一发表了「Attention Is All You Need」,其中提出的 Transformer 架构奠定了当今所有大语言模型的基础。

虽然在署名中他排最后,但论文中有一条脚注写着「Equal contribution. Listing order is random.」排名纯属随机。

但同年他从谷歌离职,创立 NEAR Protocol,致力于将 AI 与区块链技术融合。

IronClaw 背后是 NEAR Protocol 一个更大的战略构想:用户自有 AI(User-Owned AI)。

在这个愿景中,用户完全掌控自己的数据和资产,AI 智能体在可信环境中代替用户执行任务。

NEAR 已经为此搭建了 AI 云平台和去中心化 GPU 市场等基础设施,IronClaw 是这套体系的运行时层。

菠萝哥甚至开发了一个智能体互相雇佣的市场。

在 NEAR 的 market.near.ai 上,用户可以将自己专业化的智能体注册上线,随着智能体积累声誉,它将获得更多高价值的任务。

当被问到普通人未来五年如何适应 AI 时代时,菠萝哥的建议是尽快采用 AI 智能体的工作方式,学会将完整的工作流程交给它自动化处理。

他的这种判断并非近期才突然产生。

早在 2017 年创立 NEAR AI 时,菠萝哥就在告诉所有人 "未来你只需要和计算机对话,不再需要写代码"。

当时人们觉得他们疯了,是在说胡话。

九年过去了,这件事正在变成现实。

"AI 智能体是人类与线上一切交互的终极界面,"Polosukhin 写道,"但让我们把它做得安全。"

GitHub 地址:
github.com/nearai/iron...

参考链接:
www.reddit.com/r/MachineLe...

欢迎在评论区留下你的想法!

--- ---

相关推荐
量子位3 小时前
1秒1元!Seedance 2.0模型定价公布,短剧真的要被颠覆了
aigc·ai编程
量子位3 小时前
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
gpt·ai编程
爱吃的小肥羊4 小时前
GPT-5.4 来了,OpenAI 终于急了,操控电脑超越人类,国内怎么用?
chatgpt·openai
小碗细面5 小时前
GPT-5.4 深度评测:百万上下文+原生操控电脑,这次真的超越人类了?
chatgpt·ai编程
子昕7 小时前
GPT-5.4深夜发布,最适合Agent开发的天选模型登场了
ai编程
踩着两条虫7 小时前
如何让AI精准修改你的Vue代码?揭秘增量更新器实现原理
人工智能·openai·ai编程
vivo互联网技术8 小时前
Vibe Coding 之我们距离 “贾维斯” 还有多远
ai编程·工作流引擎·vibecoding
机器之心8 小时前
高德纳:「震惊!震惊!」Claude破解《计算机程序设计艺术》难题
人工智能·openai
G探险者8 小时前
从安装到上手:Codex CLI 实战指南(Windows + Node + AI Agent)
ai编程