Claude Fable 5 接入实操：模型变化、Messages API 差异与国内调用

前言

2026 年 6 月 9 日，Anthropic 发布 Claude Fable 5（claude-fable-5），定位为其最强的广泛发布模型，支持 100 万 token 上下文、128k 输出、自适应思考。本文整理其规格、Messages API 关键差异（拒绝/回退、思考输出）以及国内 OpenAI SDK 兼容接入方式。

一、核心规格

复制代码

模型 ID:      claude-fable-5
定位:         Anthropic 最强广泛发布模型（最苛刻推理 + 长周期 Agent）
上下文:       100 万 token（默认）
单次输出:     最高 128k token
思考模式:     自适应思考始终开启（effort 参数调深度，不支持 disabled）
定价:         输入 $10 / 输出 $50（每百万 token）
上线:         2026-06-09，Claude Opus 4.8 后继
同级模型:     claude-mythos-5（无安全分类器，Project Glasswing 有限发放）

二、Messages API 关键差异（重点）

Fable 5 / Mythos 5 在 Messages API 上的行为与 Opus/Sonnet/Haiku 不同：

1. 自适应思考是唯一模式

复制代码

- thinking 未设置时即生效
- 不支持 thinking: {"type": "disabled"}
- 用 effort 参数控制思考深度与成本

2. 不返回原始思维链

复制代码

- thinking.display 默认 "omitted"（返回空 thinking 块）
- 设 display: "summarized" 可获可读思考摘要
- 同模型多轮对话：thinking 块原样回传

3. 拒绝（refusal）与回退（fallback）

Fable 5 带安全分类器；拒绝时返回 HTTP 200 + stop_reason: "refusal"，并标明拒绝的分类器
被拒请求可换另一 Claude 模型重试：服务端 fallbacks 参数（Claude API / AWS 上的 Claude Platform 测试版）或 SDK 中间件客户端重试
计费：拒绝且未产出输出的请求不计费；重试退还切换产生的提示缓存成本

发布即支持：Effort、任务预算（beta 头 task-budgets-2026-03-13）、记忆工具、上下文编辑（beta 头 context-management-2025-06-27）、压缩、视觉。

三、国内接入（OpenAI SDK 兼容）

python 复制代码

from openai import OpenAI

# Claude 为海外模型，走 dataeyes.ai 国际站
client = OpenAI(
    api_key="YOUR_KEY",
    base_url="https://cloud.dataeyes.ai/v1"
)

resp = client.chat.completions.create(
    model="claude-fable-5",
    messages=[
        {"role": "system", "content": "你是严谨的长周期任务规划助手"},
        {"role": "user", "content": "拆解一个需要连续运行数小时的代码库重构 Agent 流程"}
    ]
)
print(resp.choices[0].message.content)

实务建议： Fable 5 单价高（ $10/$ 50），适合"分级调用"------难任务上 Fable 5，常规任务切便宜模型；配合它的"拒绝→回退"机制，用聚合平台一个 Key 管多模型最顺手。