GLM-4.6:先进的 Agentic、推理和编码能力

都在过年吗??

节前最后一两天都在集中发东西。

看起来deepseek今天春节的成功,大家是都借鉴了。。

2025-09-30 · 研究

转载


今天,我们发布了旗舰模型的最新版本:GLM-4.6。与 GLM-4.5 相比,这一代产品带来了几项关键改进:

  • 更长的上下文窗口: 上下文窗口从 128K 扩展到 200K tokens,使模型能够处理更复杂的 agentic 任务。
  • 卓越的编码性能: 该模型在代码基准测试中获得更高分数,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用中展现出更好的实际表现,包括在生成视觉精美的前端页面方面的改进。
  • 高级推理: GLM-4.6 在推理性能上显示出明显改进,并支持推理期间的工具使用,从而带来更强的整体能力。
  • 更强大的 agents: GLM-4.6 在工具使用和基于搜索的 agents 方面表现出更强的性能,并在 agent 框架中更有效地集成。
  • 精炼的写作: 在风格和可读性方面更好地符合人类偏好,并在角色扮演场景中表现得更加自然。

我们在涵盖 agents、推理和编码的八个公共基准测试中对 GLM-4.6 进行了评估。结果显示,相比 GLM-4.5 有明显提升,GLM-4.6 相对于 DeepSeek-V3.2-ExpClaude Sonnet 4 等国内外领先模型也具有竞争优势,但在编码能力方面仍落后于 Claude Sonnet 4.5。

实际体验比排行榜更重要。我们在 GLM-4.5 的基础上扩展了 CC-Bench ,增加了更具挑战性的任务,人类评估员在隔离的 Docker 容器中与模型协作,完成跨前端开发、工具构建、数据分析、测试和算法的多轮实际任务。GLM-4.6 在 GLM-4.5 基础上有所改进,与 Claude Sonnet 4 接近持平(48.6% 胜率),同时明显优于其他开源基线。

从 token 效率角度来看,GLM-4.6 完成任务所需的 tokens 比 GLM-4.5 少约 15%,显示出能力和效率的双重提升。

开始使用

Z.ai API 平台调用 GLM-4.6 API

Z.ai API 平台提供 GLM-4.6 和 GLM-4.6-Air 两种模型。有关全面的 API 文档和集成指南,请参阅 docs.z.ai/guides/llm/... OpenRouter 访问这两个模型。

将 GLM-4.6 与编码 Agents 配合使用

GLM-4.6 现已可在编码 agents(Claude Code、Kilo Code、Roo Code、Cline 等)中使用。

对于 GLM Coding Plan 订阅用户 :您将自动升级到 GLM-4.6。如果您之前自定义过应用配置(如 Claude Code 中的 ~/.claude/settings.json),只需将模型名称更新为 "glm-4.6" 即可完成升级。

对于新用户 :GLM Coding Plan 以 1/7 的价格提供 Claude 级别的性能,并提供 3 倍的使用配额。立即开始构建:z.ai/subscribe。

Z.ai 上与 GLM-4.6 聊天

通过选择 GLM-4.6 模型选项,可以在 Z.ai 上访问 GLM-4.6。

本地部署 GLM-4.6

GLM-4.5 和 GLM-4.5-Air 的基础版本和对话版本的模型权重在 HuggingFace 和 ModelScope 上公开可用。对于本地部署,GLM-4.5 支持包括 vLLM 在内的推理框架。

相关推荐
小虎AI生活11 小时前
WorkBuddy 的下一块拼图,居然是这个能力!
ai编程
米小虾13 小时前
联合国发布首份全球AI评估报告:我们正站在AI治理的十字路口
aigc·ai编程
AlbertZein17 小时前
Agent任务实测:谁能稳定跑完,谁只是看起来很强?
aigc·openai·ai编程
莪_幻尘17 小时前
你的 AI Skill 越多越蠢?Token 上下文爆炸的求生指南
前端·ai编程
轻口味18 小时前
别被模型宣传骗了,真实 Agent 任务一跑就知道
agent·ai编程
AlbertZein18 小时前
别被模型宣传骗了,真实 Agent 任务一跑就知道
aigc·openai·ai编程
Java陈序员19 小时前
一站式本地监控!一款开源的 Token 用量监控分析工具!
ai编程·claude·cursor
妙码生花19 小时前
从 PHP 到 AI + Golang,程序员自救转型手记(十七):登录接口完善,登录页接口整合,解决跨域
前端·后端·ai编程
小碗细面19 小时前
让 AI Agent 真正读懂你的资料:我开源了 source-skill-pipeline
aigc·ai编程·claude