Claude Fable 5 接入实操:模型变化、Messages API 差异与国内调用

前言

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5(claude-fable-5),定位为其最强的广泛发布模型,支持 100 万 token 上下文、128k 输出、自适应思考。本文整理其规格、Messages API 关键差异(拒绝/回退、思考输出)以及国内 OpenAI SDK 兼容接入方式。

一、核心规格

复制代码
模型 ID:      claude-fable-5
定位:         Anthropic 最强广泛发布模型(最苛刻推理 + 长周期 Agent)
上下文:       100 万 token(默认)
单次输出:     最高 128k token
思考模式:     自适应思考始终开启(effort 参数调深度,不支持 disabled)
定价:         输入 $10 / 输出 $50(每百万 token)
上线:         2026-06-09,Claude Opus 4.8 后继
同级模型:     claude-mythos-5(无安全分类器,Project Glasswing 有限发放)

二、Messages API 关键差异(重点)

Fable 5 / Mythos 5 在 Messages API 上的行为与 Opus/Sonnet/Haiku 不同:

1. 自适应思考是唯一模式

复制代码
- thinking 未设置时即生效
- 不支持 thinking: {"type": "disabled"}
- 用 effort 参数控制思考深度与成本

2. 不返回原始思维链

复制代码
- thinking.display 默认 "omitted"(返回空 thinking 块)
- 设 display: "summarized" 可获可读思考摘要
- 同模型多轮对话:thinking 块原样回传

3. 拒绝(refusal)与回退(fallback)

  • Fable 5 带安全分类器;拒绝时返回 HTTP 200 + stop_reason: "refusal",并标明拒绝的分类器
  • 被拒请求可换另一 Claude 模型重试:服务端 fallbacks 参数(Claude API / AWS 上的 Claude Platform 测试版)或 SDK 中间件客户端重试
  • 计费:拒绝且未产出输出的请求不计费;重试退还切换产生的提示缓存成本

发布即支持:Effort、任务预算(beta 头 task-budgets-2026-03-13)、记忆工具、上下文编辑(beta 头 context-management-2025-06-27)、压缩、视觉。


三、国内接入(OpenAI SDK 兼容)

python 复制代码
from openai import OpenAI

# Claude 为海外模型,走 dataeyes.ai 国际站
client = OpenAI(
    api_key="YOUR_KEY",
    base_url="https://cloud.dataeyes.ai/v1"
)

resp = client.chat.completions.create(
    model="claude-fable-5",
    messages=[
        {"role": "system", "content": "你是严谨的长周期任务规划助手"},
        {"role": "user", "content": "拆解一个需要连续运行数小时的代码库重构 Agent 流程"}
    ]
)
print(resp.choices[0].message.content)

实务建议: Fable 5 单价高(10/50),适合"分级调用"------难任务上 Fable 5,常规任务切便宜模型;配合它的"拒绝→回退"机制,用聚合平台一个 Key 管多模型最顺手。

相关推荐
阳光是sunny7 小时前
别再被 worktree 绕晕了!AI 编程时代你必须掌握的 Git 隔离神器
前端·人工智能·后端
冬奇Lab8 小时前
每日一个开源项目(第148篇):obsidian-skills - Obsidian CEO 亲写的 AI Agent 格式规范,让 Agent 不再破坏你的 Vault
人工智能·开源·资讯
ethantan8 小时前
AI Agent 组成:像人一样思考的智能体
人工智能·程序员·架构
冬奇Lab8 小时前
Workflow 系列(05):评测体系——三层测试结构与 Trace 追踪
人工智能·工作流引擎
ethantan9 小时前
一篇讲解AI Agent 组成:像人一样思考的智能体
人工智能·后端·程序员
Cosolar11 小时前
vLLM 生产级部署完全指南
人工智能·后端·架构
CodePlayer竟然被占用了11 小时前
被美国政府封杀18天,Claude Fable 5 回来了——但代价是什么?
人工智能
IT_陈寒11 小时前
垃圾回收器选错了,我的Java服务内存炸了
前端·人工智能·后端
smartpi12 小时前
SmartPi GPIO 脉冲与回复语执行时序指南
人工智能
阿里云大数据AI技术12 小时前
PAI支持一键部署GLM-5.2,Coding能力比肩Claude Opus 4.8
人工智能