安全的另一面是阀门:Fable管制背后的结构变化

文章目录

  • 1、前言
  • 2、先把事实摆齐:被管制的这三天
    • [2.1 三天,从发布到关停](#2.1 三天,从发布到关停)
    • [2.2 一个被忽略的事实:恢复的钥匙,比锁早装好了两个月](#2.2 一个被忽略的事实:恢复的钥匙,比锁早装好了两个月)
  • 3、上升一层:安全的另一面,是阀门
    • [3.1 Mythos 5 暴露了一件事:模型有一个"能力旋钮"](#3.1 Mythos 5 暴露了一件事:模型有一个"能力旋钮")
    • [3.2 越安全、越可治理,就越可被管制](#3.2 越安全、越可治理,就越可被管制)
    • [3.3 不是 Anthropic 一家:三家厂商的"可治理性光谱"](#3.3 不是 Anthropic 一家:三家厂商的"可治理性光谱")
  • 4、再上升一层:这堵墙会漏------加密战争的镜鉴
    • [4.1 三十年前,美国也曾把"数学"列为军火](#4.1 三十年前,美国也曾把"数学"列为军火)
    • [4.2 软墙 vs 硬墙:会漏的和卡得死的](#4.2 软墙 vs 硬墙:会漏的和卡得死的)
    • [4.3 证据:软墙已经在漏,硬墙也在被翻](#4.3 证据:软墙已经在漏,硬墙也在被翻)
  • [5、落到地面:作为 AI 从业者,我们该怎么办](#5、落到地面:作为 AI 从业者,我们该怎么办)
    • [5.1 总原则:把模型当"可替换的依赖",而不是"信仰"](#5.1 总原则:把模型当"可替换的依赖",而不是"信仰")
    • [5.2 三件今天就能做的事](#5.2 三件今天就能做的事)
      • [5.2.1 把模型名抽象成路由层,别硬编码](#5.2.1 把模型名抽象成路由层,别硬编码)
      • [5.2.2 给每个能力建一张"降级矩阵"](#5.2.2 给每个能力建一张"降级矩阵")
      • [5.2.3 把"供应商可被关闭性"写进架构评审清单](#5.2.3 把"供应商可被关闭性"写进架构评审清单)
    • [5.3 再上一层:认知差不在"喊口号",在工程能力](#5.3 再上一层:认知差不在"喊口号",在工程能力)
  • 6、总结
    • [📌 本文事实核验与一手信源](#📌 本文事实核验与一手信源)

🍃作者介绍:AI 应用负责人/AI产品架构师,阿里云专家博主。专注 LLM 应用开发、Agent 系统设计、具身智能与工业 AI 落地。日常在大模型训练、Coding Agent 工具链、AI 产品商业化等方向持续输出实战内容。

🦅个人主页:@逐梦苍穹

🐼GitHub主页:https://github.com/XZL-CODE

✈ 您的一键三连,是我创作的最大动力🌹

1、前言

最近 AI 圈最热的一件事,是 Anthropic 刚发布三天的 Fable 5,被美国政府一纸"出口管制指令"叫停。网上很快流传一篇分析,把它定性成"AI 行业第一道身份墙",读起来很唬人,但信源被评论区追着打,有人直接说那几个链接"根本不存在"。

我做的第一件事不是站队,是核验。我把那篇文章里的每一个事实------模型是不是真的、管制是不是真的、那几个被质疑的 Anthropic 链接是不是真的------挨个对着一手信源查了一遍。

结论有点反转:核心事实基本是真的。 Fable 5、Mythos 5 真实存在(2026 年 6 月 9 日发布);三天后(6 月 12 日下午 5 点 21 分 ET)确实收到一纸管制指令;那几个被骂"假"的链接,全都能打开。被夸大的不是"有没有这件事",而是"这件事意味着什么"------原文给的答案是老掉牙的"所以要自主可控",焦虑拉满,认知差为零。

作为一名天天用 Claude Code、靠各家模型 API 吃饭的 AI 从业者,我想给一个不一样的判断:

这件事真正的信号,不是"墙来了",而是------AI 第一次有了一个可以被远程拧动的"阀门"。而你越是选了那个"最安全"的模型,你手里的阀门,就越握在别人手上。

这篇文章分三层走:先把事实摆齐(第 2 节),再往上看两层结构------阀门 (第 3 节)与一堵会漏的墙(第 4 节),最后落回我们自己的地面(第 5 节:今天就能做的三件事)。

文中每一个关键事实,我都在文末列了一手信源,可自行复核------毕竟这篇文章的起点,就是"先核验再评论"。

2、先把事实摆齐:被管制的这三天

在给任何判断之前,先用一张时间线把事情过一遍。看清楚顺序,比看任何解读都重要。

2.1 三天,从发布到关停

时间 事件
2026-04-07 Anthropic 启动 Project Glasswing:把 Mythos 预览版开放给约 50 家伙伴做防御性安全研究
2026-04 中 悄悄上线身份验证(合作方 Persona):政府证件 + 活体自拍,7 月 8 日对消费版生效
2026-06-09 发布 Fable 5 + Mythos 5:同架构,Fable 护栏全开、公开可用;Mythos 护栏部分解除、只给 Glasswing 伙伴
2026-06-12 17:21 ET 收到政府"出口管制指令",要求对所有非美国公民停用这两个模型
之后 因无法实时核验国籍,Anthropic 直接全球停用两个模型;Opus 4.8 等不受影响

注意三个容易被忽略的细节:

第一,禁的是"人",不是"地"。 指令针对的是"非美国公民"------无论你在不在美国境内,哪怕是 Anthropic 自己的外籍员工,一律停用。这是有记录以来,第一次由政府指令、按国籍限制一个已公开部署模型的访问权。过去的出口管制卡的是芯片(硬件),这次第一次卡到了"谁能调这个 API"。

第二,厂商验不了,只能一刀切。 每秒几十万次 API 调用,Anthropic 没有实时核验用户国籍的能力。邮箱、IP、信用卡地址都证明不了国籍。所以"精准只禁外籍"在工程上做不到,结果就是全关

第三,触发点小得有点尴尬。 按 Anthropic 官方声明,导火索是一个"狭窄的、非通用的越狱"------本质上是"让模型读一段代码库、找出并修复其中的软件漏洞"这种网络安全能力。Anthropic 公开反驳说,这种能力"在包括 OpenAI GPT-5.5 在内的其他模型上同样唾手可得"。换句话说:被卡住的不是某种独有的超能力,是一个行业里到处都有的能力。

2.2 一个被忽略的事实:恢复的钥匙,比锁早装好了两个月

原文最容易误导人的地方,是把"上传身份证恢复访问"说成 Anthropic 为这次管制专门设计的方案,渲染成"破天荒第一次"。

核验下来不是这样:那套基于 Persona 的身份验证,2026 年 4 月中就上线了 ,比 6 月的管制早了将近两个月,本来的用途是合规、年龄验证、屏蔽受限地区(中国大陆、俄罗斯、朝鲜)。管制发生后,它只是被"顺手"赋予了一个新用途------验证美国公民身份,给确认是美国国籍的用户单独恢复 Fable 5

这个细节不起眼,但很关键:锁不是临时焊的,钥匙孔早就预留好了。 这恰恰说明,"按身份开关能力"这件事,在事件爆发之前,就已经是基础设施的一部分了。

记住这一点,我们上升到第二节的核心------阀门。

3、上升一层:安全的另一面,是阀门

3.1 Mythos 5 暴露了一件事:模型有一个"能力旋钮"

把 Fable 5 和 Mythos 5 放在一起看,你会发现一个被大多数人忽略的设计事实。

它俩是同一个底座模型。区别只有一个:

  • Fable 5:护栏全开,网络安全 / 生物 / 化学等敏感能力被限制,公开可用。
  • Mythos 5 :同一个模型,护栏部分解除 ,只发放给经过审核的 Glasswing 伙伴。

这意味着什么?意味着这个模型的"能力上限"不是固定的,而是一个可以按身份拧动的旋钮:给你审核通过的身份,旋钮往上拧,放出更强的能力;给你普通身份,旋钮往下压,只给"安全档"。

@Mufan 在评论区吐槽原文"Fable 有护栏,根本做不了 cyber/bio"------他是对的,但只说对了一半。公开的 Fable 做不了,不代表这个底座做不了。 同一个模型,护栏一解除(Mythos),它就能去 Glasswing 项目里挖出两万多个高危漏洞。能力一直在,只是阀门拧在不同的位置。

我的判断:真正值得关注的技术拐点,不是"模型变强了",而是"模型的能力第一次变成了可以被外部精确调档的变量"。 安全路由(safety routing)这套技术,让厂商能按 prompt、按身份动态决定"放多少能力出来"。它是护栏,也是阀门------一体两面。

3.2 越安全、越可治理,就越可被管制

这就引出一个反直觉的结论。

我们默认"安全"是纯粹的好事。但从控制权的角度看:一个能被安全护栏精确控制能力的模型,天然就是一个能被第三方精确管制的模型。

Anthropic 是这一轮里把"安全"做得最重的公司------Responsible Scaling 政策、ASL(AI 安全等级)框架、Frontier Red Team、Constitutional AI。这套东西的本质,是给模型装上一个又一个精密的控制点。控制点越多、越精密,模型就越"可治理"。

可"可治理"的另一面,就是"可被治理"------当政府想管,它发现这家公司早就把所有阀门都装好了,只需要发一道指令,让对方把某个阀门拧到底。

这不是 Anthropic 的失误,恰恰是它价值观路线的必然代价。安全和主权,是同一枚硬币的两面:你为了让模型"可控"所建的每一个开关,最终都可能变成别人手里的遥控器。

一年前我写过一句判断:Anthropic 和 OpenAI 的分野,"这不是产品竞争,是价值观选择"。 这篇可以看成它的续集------价值观路线在地缘政治下的账单,到了。 走安全优先这条路,你会更合规、更被企业信任,但你也把自己变成了最容易被监管接管的那一个。

3.3 不是 Anthropic 一家:三家厂商的"可治理性光谱"

有人会说:那是 Anthropic 自己太"乖"。但核验里有个细节直接否掉了这个解释------OpenAI 几乎在同一时间做了一模一样的事。

2026 年 4 月,OpenAI 上线 GPT-5.4-Cyber,一个网络安全专用模型,也是只能通过 KYC 式的身份验证 ("Trusted Access for Cyber")才能用。Anthropic 用 Glasswing 审核伙伴,OpenAI 用 Trusted Access 审核个人------两家头部闭源厂商,不约而同地把"强能力"锁进了"身份门"后面。

把三类玩家排在一条"可治理性光谱"上,结构就清楚了:

玩家 路线 可治理性 地缘上的处境
Anthropic(Fable/Mythos) 安全优先、护栏精密 极高 最容易被一键管制
OpenAI(GPT-5.x / Cyber) 商业 + 政治整合、KYC 准入 同样在装阀门
开源权重(DeepSeek / Qwen / GLM) 权重公开、不可回收 极低 想管也管不住

你发现没有:在"可被管制"这件事上,越是规范、越是安全、越是头部的闭源模型,处境越被动;反倒是那些"不可治理"的开源权重,在地缘上是最自由的。

这是一个我们做技术选型时几乎从不计价的隐性成本------当你选了那个最合规、最安全的闭源模型,你同时也选择了"它的可被管制性"。 平时这是优点,极端情况下,它是你的单点故障。

4、再上升一层:这堵墙会漏------加密战争的镜鉴

第 3 节讲的是"阀门怎么来的"。这一节回答另一个问题:这堵"身份墙",真的拦得住吗?

要回答它,不用预测未来,回头看一段历史就够了。

4.1 三十年前,美国也曾把"数学"列为军火

1990 年代,美国政府干过一件今天看来很荒诞的事:把强加密算法列为"军火"(munitions)来管制出口。

当时的逻辑和今天一模一样:强加密是战略能力,不能让"敌人"拿到。于是密码学软件被归到 ITAR(国际武器贸易条例)下,出口强加密等同于走私军火。

最有名的受害者是 PGP 的作者 Phil Zimmermann------他把邮件加密软件 PGP 放到了互联网上,因为"可被外国人下载",被美国政府以涉嫌非法出口军火刑事调查了三年 (1993--1996)。后来还有著名的 Bernstein 诉美国案,法院最终认定:源代码是受宪法第一修正案保护的言论。

结局是什么?管制失败了。 到 1996--2000 年,美国基本放开了对加密出口的管制。原因很简单------

你没法对"数学"和"代码"做出口管制。它不是实体,可被复制、可被传播、可被任何人重写。你越想关住它,它越是从每一条网线里漏出去。

4.2 软墙 vs 硬墙:会漏的和卡得死的

加密战争给今天的"AI 身份墙"提供了一面镜子。但直接套"所以 AI 管制也会失败"就太偷懒了------AI 和加密有一个关键区别:AI 吃算力。

所以这里要做一个区分,我把它叫做软墙和硬墙

  • 软墙 = 访问权 / 模型权重 / 算法。 像加密一样,是信息。信息会漏:开源权重一旦放出,全球可下载,你再发多少道"身份墙"指令,对已经扩散出去的权重都没有意义。
  • 硬墙 = 算力 / 先进芯片。 这是物理实体,产能集中、可追踪、卡得死。真正能"卡脖子"的从来是这一层。

把这两层分清楚,你对这次事件的判断会完全不同:

我的判断:Fable 的"身份墙"是一堵软墙,长期看大概率会漏------要么管制松动,要么能力被同级的开源/闭源模型平替。真正决定格局的,不是这堵会漏的软墙,是底下那堵不会漏的算力硬墙。访问权管制是台前的表演,算力管制才是幕后的实质。

4.3 证据:软墙已经在漏,硬墙也在被翻

这不是推演,核验里有实打实的证据。

软墙在漏: 中国的开源模型已经把能力差距追到很近。据公开评测,DeepSeek V4 Pro 在综合基准上已逼近 GPT-5.4(87 比 88),而且是开源权重、价格只有 Fable 5 的约 1/35(每百万输入 token 约 0.28 美元 vs Fable 5 的 10 美元)。当一个能力相当、价格便宜 35 倍的开源平替全球可下载时,"禁止某国公民访问某个闭源模型"这件事,对产业的实际杀伤力是很有限的。

硬墙也在被翻: 更值得注意的是算力这层。智谱的 GLM-5.1,完全跑在华为昇腾芯片上训练出来,全程没用英伟达,据公开评测还在某项编程基准上超过了 Claude Opus 4.6。这意味着,连"算力硬墙"------这堵本该最难翻的墙------也开始出现绕行路线。

我想强调的是:这两件事都不是"喊口号喊出来的",是被硬约束逼出来的工程结果。 从 2022 年 10 月芯片管制开始,被堵死英伟达高端卡这条路之后,国内团队被迫去抠软件效率、押注国产硅。结果就是 DeepSeek 那种"省到极致"的 MoE 工程,和 GLM 那种"换条腿走路"的硬件替代。

这恰恰印证了我一直的一个判断:真正的破局点,从来不在"喊自主可控"这四个字,而在被约束逼出来的工程能力和组织机制。 管制是坏事,但它意外地把"工程效率"和"硬件自给"这两件本该慢慢做的事,按了快进键。

5、落到地面:作为 AI 从业者,我们该怎么办

讲了两层结构,最后必须落回我们自己能动手的地方。否则就和那篇"所以要自主可控"的焦虑文没区别了------看清结构是为了行动,不是为了焦虑。

先说一个总原则,再给三件今天就能做的事。

5.1 总原则:把模型当"可替换的依赖",而不是"信仰"

这次事件给应用层最大的教训,浓缩成一句话:

不要把任何一个闭源模型,当成你架构里"永远在线、永远是这个能力档位"的东西。它可以被一封邮件降级,可以被一道指令关停,可以在某天对你这个地区/身份不再开放。

这不是政治判断,是工程判断 。它和你在数据库层做 DAO 抽象、不把业务逻辑焊死在 MySQL 上,是同一个道理------你不是不信任 MySQL,你只是不把"不可替换"这种风险留在架构里。 对模型也一样。

5.2 三件今天就能做的事

5.2.1 把模型名抽象成路由层,别硬编码

去翻你的代码库,搜一下有没有写死的 claude-fable-5gpt-5.5 这种字符串。全部收口到一个配置 / 网关 / 适配器层里。模型标识符应该是配置项,不是散落在业务代码里的魔法字符串。今天被管的是 Fable,明天可能就不是它------你要的是改一行配置就能切换,而不是全库 grep。

5.2.2 给每个能力建一张"降级矩阵"

不是"出事了再想办法",是提前为每个关键能力写好 fallback 链

能力 首选(满血闭源) 备选(同级闭源) 兜底(本地/开源)
复杂推理 模型 A 模型 B 本地开源大模型
代码生成 模型 A 模型 B 本地 Coder 模型
一般对话 模型 A 本地开源 本地开源(小)

关键不是表格本身,是背后那个默认假设要变 :从"我调的模型永远是满血的",变成"我调的模型随时可能被降档,我的系统要能在降档下继续跑"。Mythos 5 那个"能力旋钮"已经告诉你,能力档位是会变的------那你的架构就得按"能力可变"来设计。

5.2.3 把"供应商可被关闭性"写进架构评审清单

做技术选型评审时,除了性能、价格、上下文长度,再加一行硬指标:这个供应商,可被第三方关闭的风险有多大? 具体落到三个问题------

  • 能不能多供应商? 至少留一个能力相近的备份通道。
  • 数据可不可迁移? Prompt、知识库、微调数据,别锁死在单一平台的私有格式里。
  • 关键链路有没有本地兜底? 哪怕能力降一档,核心业务也不能整条断掉。

5.3 再上一层:认知差不在"喊口号",在工程能力

最后回到那个老问题:这件事是不是又一次证明了"要自主可控"?

是,但绝大多数人理解错了方向。

"自主可控"不是一句政治口号,更不是"全部换国产"这种偷懒解------把工程问题政治化,是最没有认知差的反应。它真正的含义,是在每一个可能被卡脖子的环节上,你至少有一个自己能做主的选项:算力上,GLM 证明了昇腾这条腿能走;模型上,DeepSeek 证明了开源平替能打;应用上,你的抽象层证明了"换谁都能跑"。

不一定是最强的。但要是你自己能掌控的。

散户对抗机构靠的是认知差和灵活,AI 从业者对抗不确定性靠的也不是站队,是抽象。 你没法决定哪个模型明天会被关,但你可以决定:你的系统不依赖"它永远开着"这个假设。

6、总结

把这篇的判断收一下口:

  1. 事实层:Fable 5 被管制是真事,核心信源都可核验。被夸大的是解读,不是事件。
  2. 第一层结构(阀门) :真正的拐点是模型能力变成了"可按身份调档的变量"。安全路由既是护栏也是阀门------越安全、越可治理的模型,越容易被第三方接管控制权。
  3. 第二层结构(软硬墙):身份墙是会漏的软墙,加密战争三十年前就演示过结局;真正卡得死的是算力硬墙。而软墙在漏(开源平替)、硬墙在被翻(国产硅),都是硬约束逼出来的工程结果。
  4. 落地(抽象):作为 AI 从业者,把模型当可替换依赖------路由层、降级矩阵、供应商可关闭性评审。认知差不在喊口号,在工程能力。

如果这篇只能留下一句话,我希望是这句:

最坏的情况,从来不是竞争对手比你强;而是你依赖的东西,可以被一封邮件关掉。而 AI 从业者应对这种不确定性的方式,从来不是站队,是抽象。


📌 本文事实核验与一手信源

本文所有关键事实均对照一手信源核验,供复核:

加密战争(Crypto Wars)、PGP/Zimmermann 调查、Bernstein 诉美国案为公开历史,可自行检索复核。