GLM-4.6:先进的 Agentic、推理和编码能力

都在过年吗??

节前最后一两天都在集中发东西。

看起来deepseek今天春节的成功,大家是都借鉴了。。

2025-09-30 · 研究

转载


今天,我们发布了旗舰模型的最新版本:GLM-4.6。与 GLM-4.5 相比,这一代产品带来了几项关键改进:

  • 更长的上下文窗口: 上下文窗口从 128K 扩展到 200K tokens,使模型能够处理更复杂的 agentic 任务。
  • 卓越的编码性能: 该模型在代码基准测试中获得更高分数,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用中展现出更好的实际表现,包括在生成视觉精美的前端页面方面的改进。
  • 高级推理: GLM-4.6 在推理性能上显示出明显改进,并支持推理期间的工具使用,从而带来更强的整体能力。
  • 更强大的 agents: GLM-4.6 在工具使用和基于搜索的 agents 方面表现出更强的性能,并在 agent 框架中更有效地集成。
  • 精炼的写作: 在风格和可读性方面更好地符合人类偏好,并在角色扮演场景中表现得更加自然。

我们在涵盖 agents、推理和编码的八个公共基准测试中对 GLM-4.6 进行了评估。结果显示,相比 GLM-4.5 有明显提升,GLM-4.6 相对于 DeepSeek-V3.2-ExpClaude Sonnet 4 等国内外领先模型也具有竞争优势,但在编码能力方面仍落后于 Claude Sonnet 4.5。

实际体验比排行榜更重要。我们在 GLM-4.5 的基础上扩展了 CC-Bench ,增加了更具挑战性的任务,人类评估员在隔离的 Docker 容器中与模型协作,完成跨前端开发、工具构建、数据分析、测试和算法的多轮实际任务。GLM-4.6 在 GLM-4.5 基础上有所改进,与 Claude Sonnet 4 接近持平(48.6% 胜率),同时明显优于其他开源基线。

从 token 效率角度来看,GLM-4.6 完成任务所需的 tokens 比 GLM-4.5 少约 15%,显示出能力和效率的双重提升。

开始使用

Z.ai API 平台调用 GLM-4.6 API

Z.ai API 平台提供 GLM-4.6 和 GLM-4.6-Air 两种模型。有关全面的 API 文档和集成指南,请参阅 docs.z.ai/guides/llm/... OpenRouter 访问这两个模型。

将 GLM-4.6 与编码 Agents 配合使用

GLM-4.6 现已可在编码 agents(Claude Code、Kilo Code、Roo Code、Cline 等)中使用。

对于 GLM Coding Plan 订阅用户 :您将自动升级到 GLM-4.6。如果您之前自定义过应用配置(如 Claude Code 中的 ~/.claude/settings.json),只需将模型名称更新为 "glm-4.6" 即可完成升级。

对于新用户 :GLM Coding Plan 以 1/7 的价格提供 Claude 级别的性能,并提供 3 倍的使用配额。立即开始构建:z.ai/subscribe。

Z.ai 上与 GLM-4.6 聊天

通过选择 GLM-4.6 模型选项,可以在 Z.ai 上访问 GLM-4.6。

本地部署 GLM-4.6

GLM-4.5 和 GLM-4.5-Air 的基础版本和对话版本的模型权重在 HuggingFace 和 ModelScope 上公开可用。对于本地部署,GLM-4.5 支持包括 vLLM 在内的推理框架。

相关推荐
量子位5 小时前
DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配
ai编程·deepseek
用户4099322502127 小时前
PostgreSQL索引这么玩,才能让你的查询真的“飞”起来?
后端·ai编程·trae
追逐时光者8 小时前
一款基于 AI 大模型驱动、开源且强大的知识库搭建系统,支持 AI 创作、问答、搜索等能力!
ai编程
yaocheng的ai分身9 小时前
Anthropic 官方《用 Claude Agent SDK 构建智能体》
ai编程
子昕9 小时前
Claude 4.5来了!82%碾压GPT-5,AI编程体验彻底变了
ai编程
yaocheng的ai分身9 小时前
cursor 1.7更新
ai编程
yaocheng的ai分身9 小时前
重建 Devin 以适配 Claude Sonnet 4.5:经验与挑战
ai编程
yaocheng的ai分身9 小时前
Vibe Check:Claude Sonnet 4.5
ai编程
Jagger_20 小时前
掌握WBS:提升项目管理效率的实用指南
aigc·openai·ai编程