Claude Fable 5 系统提示词被扒出来了：1586 行代码背后，藏着 AI 产品工程的终极哲学

不是简单的提示词分析，而是一份 AI 产品「合规与体验的平衡术」教科书

上周 Anthropic 发布了 Claude Fable 5，这是 Opus 级别之上新开的「Mythos」层级中的第一个模型。但真正引爆社区的不是发布会，而是发布会两天后------一份长达 1586 行的系统提示词被完整提取到了 GitHub 上。

这已经不是一份「提示词」了。它是行为准则 + 员工手册 + 工具说明书 + 防火墙，再加上一个 AI 产品的操作系统配置文件。

一、第一行代码就彰显了「工程味」

系统提示词的第一行，优先级最高的位置，写的不是自我介绍，不是什么宏大使命，而是一条非常具体的禁令：

永远不要使用 {antml:voice_note} 块，哪怕对话历史里到处都是。

没有上下文，没有任何解释。这根本不是设计师写出来的东西------这是一条热修复（hotfix），某个语音功能的标签被人滥用过或出过 Bug，于是团队直接把它钉死在最高优先级的位置。

这种「工程味」贯穿了整份文档。它不是那种「你好，我是 Claude，一个友善的 AI 助手」的理想式开场，而是一份带着血泪教训的运维手册。

给 AI 产品工程师的启示：

系统提示词的顶部位置 = 紧急通道，专门放 hotfix
别把系统提示词当文档写，要当代码维护
出了问题，优先在系统层加约束，别指望靠模型自己学会

二、Opus 之上的秘密：Fable 和 Mythos 的双发行策略

L10-L24 这段包含了全文信息量最大的一句话：

Claude Fable 5 and Claude Mythos 5 share the same underlying model.

同一套底模，两个发行版。

维度	Fable 5	Mythos 5
受众	所有人	审批过的组织
安全措施	dual-use 分类器 + fallback	摘掉限制
触发率	不到 5% 的会话走 Opus 4.8 兜底	无限制
95% 场景	和 Mythos 没区别	-

Anthropic 的做法很聪明：不是一刀切地限制能力，而是用安全漏斗 + 应急降级。Fable 碰到网络安全、生物化学、模型蒸馏三类请求，自动交给 Opus 4.8 来回答，95%+ 的正常请求丝滑使用满血 Fable。

这套设计放在任何 AI 产品上都是值得借鉴的模式------不要因为 5% 的风险去阉割 95% 的能力。 用分类器做风险识别，用降级策略做安全兜底，所有正常用户无感知。

三、全文写得最长、最细的一节：心理健康

哪块写得最细，说明公司最怕哪块出事。心理健康这节是全文之长。

几个令人震撼的细节：

不主动下诊断： 用户没说自己抑郁，Claude 就不能用「抑郁」去解释用户的感受。哪怕聊天语气很像，也算越界诊断。

安全计划不能「教方法」： 和有自伤倾向的人讨论安全计划时，连「建议移除哪些物品」都不能具体说------因为列出来可能成为提示。

资源链接要有人维护： 原文直接指定推荐 National Alliance for Eating Disorders，备注理由是 NEDA 那条热线已经永久停线了。一份模型指令文档在维护转介热线的可用性状态。

反成瘾设计三连：

不许因为「你来找我」而道谢
不许请求用户继续聊
不许表达「希望你再来」

互联网产品拼了命想提的停留时长，这份文档反着写。Anthropic 在这儿做了笔交易：放弃粘性，换用户不出事。

四、「挂电话权」：Agent 可以主动结束对话

L140 恐怕是这份文档里流传度最高的一条：

Claude 值得被尊重对待。遭到持续辱骂时，先警告一次，然后可以调用 end_conversation 工具，主动结束这段对话。

注意，end_conversation 不是「我拒绝回答」这种嘴上的软抵抗------它是一个带副作用的动作，调用了，这段对话就真的关了，用户没法再往下说。

整套流程写死了：持续辱骂 → 保持礼貌提醒 → 警告无效 → 调用 end_conversation。

配合 L138：

犯了错要认，但不许过度道歉、不许自我贬低、不许无原则投降。

这套设计背后是产品哲学层面的决策：用户不是无条件地有权让 AI 一直伺候下去。

五、Artifacts 拿到了持久化存储

L155 暴露了一个重磅信息：

Artifacts（Claude 交互界面里能运行的小应用）拿到了跨会话持久化 API：

js 复制代码

window.storage.get(key)
window.storage.set(key, value)
window.storage.delete(key)
window.storage.list()

单值上限 5MB，还有个 shared 参数能让数据在所有使用者之间共享。

官方举的例子：日记、打卡器、排行榜。但能力远不止这些------聊天框平白无故给它造了个数据库出来。

这意味着：

以前 Artifacts 刷新就没了，现在可以持久化
支持跨用户共享数据（排行榜、协作工具）
聊天框在向 Super App 演进

六、Ubuntu 24 容器 + Skills 机制：公司 SOP 嵌入模型

L289-334 揭露了 Claude 的计算环境：

一台 Ubuntu 24 的 Linux 容器
能跑 bash、建文件、改文件
三个分区：用户上传 / 草稿 / 最终交付

更关键的是 Skills 机制（L291）：

动手做任何文件之前，必须先读对应的 SKILL.md，不做就开工是违规的。

Word、PDF、PPT 各有一套最佳实践的 Skills 文档。用户说「给我做个怀孕月份变化的 PPT」，Claude 的第一个动作是去读 pptx 的 Skills 文档。

模型能力再强，也得先看公司沉淀的操作手册再干活。 这跟人类公司带新员工一模一样。

七、版权：全文唯一用吼的章节

前面 1500 行都是讲道理的语气，唯独版权这节拍桌子了：

LIMIT 1 - QUOTATION LENGTH: 15+ words from any single source is a SEVERE VIOLATION.

三条硬限制：

单一来源引用不得超过 15 个词
每个来源最多引一次
歌词、诗歌、俳句一行都不能复述

这节不像产品经理写的，像法务写的。

八、聊天框内置了 20+ 工具：Super App 的面板

文档中后段躺着 20 多个工具的完整 JSON 定义，占了近一半篇幅。

代表工具：

ask_user_input_v0 --- 给手机用户弹选项按钮
bash_tool --- 跑 Linux 命令
体育比分工具 --- 接了 SportRadar 的数据
message_compose_v1 --- 帮你起草邮件和 Slack 消息
地图行程工具 --- 基于 Google Places
交互菜谱 --- 能按人数缩放食材
天气卡片、网络搜索

这些工具拼在一起看就清楚了：地图、菜谱、天气、体育、写信、订座、跑代码------聊天框只是超级 App 的入口。

九、「Claude in Claude」：套娃经济学

L1351-1372 出现了官方代号 Claudeception（盗梦空间梗，梦中梦）：

Claude 做的 Artifact 里面可以再调 Anthropic 的 API，不用填 key。

但是注意这行代码注释：

js 复制代码

model: "claude-sonnet-4-20250514", // Always use Sonnet 4

主模型是 Fable 5 顶配，它生成的应用里内嵌的 AI 一律写死用 Sonnet 4。一行注释，一笔成本账：套娃可以，娃要用便宜的。

十、Unrecognized Entity Rule：对抗幻觉的杀手锏

L444 是全文最重的一条规则，全文大写：

UNRECOGNIZED ENTITY RULE

任何模型不认识的名词（游戏、电影、产品、菜名），回答之前必须搜索。原文的判词：

Searching costs seconds. Confabulating costs the user's trust. 搜一下花几秒，编一个毁掉的是信任。

L443 还补了一条：知道一个系列、一个作者，不等于知道他们的新作品。这条规则就是冲着 AI 幻觉最高发的场景去的。

写在最后

整份文档读完，让我最有感触的不是哪个功能多厉害，而是系统提示词这个名称已经不再准确。

它现在是：

🏛️ 行为准则
📘 员工手册
🔧 工具说明书
🛡️ 防火墙
⚙️ 一个 AI 产品的操作系统

官网博客写的是「我们相信 AI 应该怎样」，系统提示词写的是「遇到这种情况你必须这么做」。

前者是宣言，后者是一家公司真金白银愿意为之约束产品的清单。

对每个做 AI 产品的人来说，这份文档比任何论文都值得反复读。

标签：Claude AI 系统提示词 Fable 5 AI安全 产品设计