Claude Fable 5 接入实操:模型变化、Messages API 差异与国内调用

前言

2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5(claude-fable-5),定位为其最强的广泛发布模型,支持 100 万 token 上下文、128k 输出、自适应思考。本文整理其规格、Messages API 关键差异(拒绝/回退、思考输出)以及国内 OpenAI SDK 兼容接入方式。

一、核心规格

复制代码
模型 ID:      claude-fable-5
定位:         Anthropic 最强广泛发布模型(最苛刻推理 + 长周期 Agent)
上下文:       100 万 token(默认)
单次输出:     最高 128k token
思考模式:     自适应思考始终开启(effort 参数调深度,不支持 disabled)
定价:         输入 $10 / 输出 $50(每百万 token)
上线:         2026-06-09,Claude Opus 4.8 后继
同级模型:     claude-mythos-5(无安全分类器,Project Glasswing 有限发放)

二、Messages API 关键差异(重点)

Fable 5 / Mythos 5 在 Messages API 上的行为与 Opus/Sonnet/Haiku 不同:

1. 自适应思考是唯一模式

复制代码
- thinking 未设置时即生效
- 不支持 thinking: {"type": "disabled"}
- 用 effort 参数控制思考深度与成本

2. 不返回原始思维链

复制代码
- thinking.display 默认 "omitted"(返回空 thinking 块)
- 设 display: "summarized" 可获可读思考摘要
- 同模型多轮对话:thinking 块原样回传

3. 拒绝(refusal)与回退(fallback)

  • Fable 5 带安全分类器;拒绝时返回 HTTP 200 + stop_reason: "refusal",并标明拒绝的分类器
  • 被拒请求可换另一 Claude 模型重试:服务端 fallbacks 参数(Claude API / AWS 上的 Claude Platform 测试版)或 SDK 中间件客户端重试
  • 计费:拒绝且未产出输出的请求不计费;重试退还切换产生的提示缓存成本

发布即支持:Effort、任务预算(beta 头 task-budgets-2026-03-13)、记忆工具、上下文编辑(beta 头 context-management-2025-06-27)、压缩、视觉。


三、国内接入(OpenAI SDK 兼容)

python 复制代码
from openai import OpenAI

# Claude 为海外模型,走 dataeyes.ai 国际站
client = OpenAI(
    api_key="YOUR_KEY",
    base_url="https://cloud.dataeyes.ai/v1"
)

resp = client.chat.completions.create(
    model="claude-fable-5",
    messages=[
        {"role": "system", "content": "你是严谨的长周期任务规划助手"},
        {"role": "user", "content": "拆解一个需要连续运行数小时的代码库重构 Agent 流程"}
    ]
)
print(resp.choices[0].message.content)

实务建议: Fable 5 单价高(10/50),适合"分级调用"------难任务上 Fable 5,常规任务切便宜模型;配合它的"拒绝→回退"机制,用聚合平台一个 Key 管多模型最顺手。

相关推荐
数智化管理手记2 小时前
三步轻量化落地法!精益赋能数字化,让工厂转型告别形式化
运维·数据库·人工智能·精益工程
福客AI智能客服2 小时前
AI客服软件开始参与商品对比,企业商品信息管理面临新的要求
人工智能
一次旅行2 小时前
【AI技术/工具】OpenPCC:用普通TEE实现机密LLM服务,隐私保护新方案
人工智能
无忧智库2 小时前
[特殊字符]【万字深度解析】一站式全域数据资产运营平台解决方案——企业数字化转型的数据治理终极答案(PPT)
大数据·人工智能
txg6662 小时前
MirrorFuzz:利用共享漏洞与大模型的深度学习框架 API 模糊测试
人工智能·深度学习·安全·网络安全
chen_zn952 小时前
GR00T N1.7源码学习(五):Policy推理、RTC动作衔接与部署流程解析
人工智能·深度学习·具身智能·vla·流匹配
我是大AI2 小时前
搜极星 GEO 监测:解锁品牌 AI 可见度管理
人工智能
明月(Alioo)2 小时前
为什么用 Skill 做需求澄清
人工智能·ai·agent
逻辑星辰2 小时前
x-ds-pow-response逆向分析
开发语言·人工智能·python·深度学习·算法