刚刚,Claude Sonnet 4.5 重磅发布,编程新王降临!

「【新智元导读】今天凌晨,Claude Sonnet 4.5 发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而 Claude Sonnet 4.5 即将成为大家争相对标的新对象。」

一图看透全球大模型!新智元十周年钜献,2025 ASI 前沿趋势报告 37 页首发

北京时间今天凌晨,Anthropic 正式发布了 Claude Sonnet 4.5。

这一版本被 Claude 定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。

代码无处不在,它驱动着应用程序、表格和各种工具。

现代工作的核心在于运用这些工具并解决复杂问题,而 Sonnet 4.5 让这一切更加高效和可靠。

「全新功能与产品升级」

伴随 Sonnet 4.5,Anthropic 对 Claude 全线产品进行了大规模更新:

  • 「Claude Code」 新增了备受期待的「检查点」(Checkpoints)功能,可随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生 VS Code 插件。
  • 「Claude」 「API」 增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。
  • 「Claude apps」 现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。
  • 「Claude for Chrome」 扩展对此前等待名单中的 Max 用户开放。

开发者社区也迎来了新的核心资源:「Claude Agent」 「SDK」

这套工具包开放了驱动 Claude Code 的底层基础设施,为所有人打造智能体提供了基础能力。

「前沿性能与基准成绩」

Sonnet 4.5 在多项权威测试中表现出色:

  • 「SWE-bench Verified」:在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过 30 小时的专注执行。
  • 「OSWorld」:在模拟真实计算机任务的基准中,以 61.4% 的成绩位居首位,而四个月前 Sonnet 4 还保持在 42.2%。

Imagine With Claude 实时生成软件演示视频

在这一体验中,Claude 会实时生成软件,没有预设功能或预写代码,用户可以直接看到 Claude 在交互过程中即时创造与适配的过程。

该功能向 Max 订阅用户开放 5 天,可在 claude.ai/imagine 上体验。

「API 新特性」

Sonnet 4.5 在 API 层面也带来了重要更新:

  • 「记忆工具(Beta)」:支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态。
  • 「上下文编辑」:通过自动清理旧的工具调用和结果来避免上下文溢出。
  • 「新的停止原因提示」 :增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成。
  • 「工具参数改进」:修复了字符串参数尾部换行被截断的问题,保证格式精确传递。
  • 「Token 计数优化」:系统会自动添加优化 Token,但用户不会为这些系统注入的部分付费。

「定价与使用渠道」

价格保持与 Sonnet 4 一致:

  • 输入:3 美元 / 百万 Tokens
  • 输出:15 美元 / 百万 Tokens

Sonnet 4.5 可通过以下渠道使用:

  • Claude API:claude-sonnet-4-5-20250929
  • Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0
  • Google Cloud Vertex AI:claude-sonnet-4-5@20250929
  • 同时也在 Claude.ai 与 Claude Code 平台上线。

「升级指南」

当前使用 Sonnet 4 的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。

所有现有 API 调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。

需要注意的是,Sonnet 4.5 不再允许同时指定 「temperature」「top_p」 参数,用户应选择其一。

「新一轮的 AI 编程大战即将来临」

Claude Sonnet 4.5 在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。

它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。

Anthropic 通过这一版本,继续推动 AI 在前沿能力和安全性上的平衡发展。

编程新王降临,新一轮围绕编程展开的百模大战即将展开,而 Claude Sonnet 4.5 即将成为大家争相对标的新对象。

参考资料:

www.anthropic.com/news/claude...

docs.claude.com/en/docs/abo...

assets.anthropic.com/m/12f214efc...

相关推荐
LplLpl1113 小时前
AI 算法竞赛通关指南:基于深度学习的图像分类模型优化实战
大数据·人工智能·机器学习
依米s14 小时前
各年度人工智能大会WAIC核心议题(持续更新)
人工智能·人工智能+·waic·人工智能大会+
python机器学习建模14 小时前
22篇经典金融风控论文复现(2025年11月更新)
人工智能·机器学习·论文·期刊·金融风控
Codebee14 小时前
深度解析AI编程技术:从原理到实践,手把手教你落地
人工智能·设计模式·开源
武汉唯众智创14 小时前
基于五级工的人工智能训练师教学解决方案
人工智能·ai·产教融合·人工智能训练师·五级工·ai训练师
执笔论英雄14 小时前
【RL】python协程
java·网络·人工智能·python·设计模式
你好~每一天15 小时前
未来3年,最值得拿下的5个AI证书!
数据结构·人工智能·算法·sqlite·hbase·散列表·模拟退火算法
老前端的功夫15 小时前
前端技术选型的理性之道:构建可量化的ROI评估模型
前端·javascript·人工智能·ubuntu·前端框架
Mxsoft61915 小时前
我发现区块链数据同步延迟,某次故障溯源卡顿,动态调整共识机制救场!
人工智能
m0_4889130115 小时前
小白也能懂!RAG技术让AI告别知识滞后,收藏学习
人工智能·学习·langchain·大模型·ai大模型·rag·大模型学习