GLM-4.6:先进的 Agentic、推理和编码能力

都在过年吗??

节前最后一两天都在集中发东西。

看起来deepseek今天春节的成功,大家是都借鉴了。。

2025-09-30 · 研究

转载


今天,我们发布了旗舰模型的最新版本:GLM-4.6。与 GLM-4.5 相比,这一代产品带来了几项关键改进:

  • 更长的上下文窗口: 上下文窗口从 128K 扩展到 200K tokens,使模型能够处理更复杂的 agentic 任务。
  • 卓越的编码性能: 该模型在代码基准测试中获得更高分数,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用中展现出更好的实际表现,包括在生成视觉精美的前端页面方面的改进。
  • 高级推理: GLM-4.6 在推理性能上显示出明显改进,并支持推理期间的工具使用,从而带来更强的整体能力。
  • 更强大的 agents: GLM-4.6 在工具使用和基于搜索的 agents 方面表现出更强的性能,并在 agent 框架中更有效地集成。
  • 精炼的写作: 在风格和可读性方面更好地符合人类偏好,并在角色扮演场景中表现得更加自然。

我们在涵盖 agents、推理和编码的八个公共基准测试中对 GLM-4.6 进行了评估。结果显示,相比 GLM-4.5 有明显提升,GLM-4.6 相对于 DeepSeek-V3.2-ExpClaude Sonnet 4 等国内外领先模型也具有竞争优势,但在编码能力方面仍落后于 Claude Sonnet 4.5。

实际体验比排行榜更重要。我们在 GLM-4.5 的基础上扩展了 CC-Bench ,增加了更具挑战性的任务,人类评估员在隔离的 Docker 容器中与模型协作,完成跨前端开发、工具构建、数据分析、测试和算法的多轮实际任务。GLM-4.6 在 GLM-4.5 基础上有所改进,与 Claude Sonnet 4 接近持平(48.6% 胜率),同时明显优于其他开源基线。

从 token 效率角度来看,GLM-4.6 完成任务所需的 tokens 比 GLM-4.5 少约 15%,显示出能力和效率的双重提升。

开始使用

Z.ai API 平台调用 GLM-4.6 API

Z.ai API 平台提供 GLM-4.6 和 GLM-4.6-Air 两种模型。有关全面的 API 文档和集成指南,请参阅 docs.z.ai/guides/llm/... OpenRouter 访问这两个模型。

将 GLM-4.6 与编码 Agents 配合使用

GLM-4.6 现已可在编码 agents(Claude Code、Kilo Code、Roo Code、Cline 等)中使用。

对于 GLM Coding Plan 订阅用户 :您将自动升级到 GLM-4.6。如果您之前自定义过应用配置(如 Claude Code 中的 ~/.claude/settings.json),只需将模型名称更新为 "glm-4.6" 即可完成升级。

对于新用户 :GLM Coding Plan 以 1/7 的价格提供 Claude 级别的性能,并提供 3 倍的使用配额。立即开始构建:z.ai/subscribe。

Z.ai 上与 GLM-4.6 聊天

通过选择 GLM-4.6 模型选项,可以在 Z.ai 上访问 GLM-4.6。

本地部署 GLM-4.6

GLM-4.5 和 GLM-4.5-Air 的基础版本和对话版本的模型权重在 HuggingFace 和 ModelScope 上公开可用。对于本地部署,GLM-4.5 支持包括 vLLM 在内的推理框架。

相关推荐
C澒23 分钟前
IntelliPro 产研协作平台:基于 AI Agent 的低代码智能化配置方案设计与实现
前端·低代码·ai编程
DanCheOo1 小时前
Harness Engineering:从“AI 辅助“到“驾驭 AI“的工程效能革命
人工智能·ai编程
XD7429716362 小时前
科技早报|2026年5月2日:AI 编程工具开始按用量收费
人工智能·科技·ai编程·github copilot·科技早报
常威正在打来福2 小时前
【技能篇】OpenClaw Skill 详解:给 AI 装上"专业外挂"
aigc·ai编程
沐风老师2 小时前
开发AI机器人操作系统用什么编程语言?
人工智能·ai编程·机器人操作系统
qq5680180762 小时前
国内如何使用Gemini 3.1 Pro?
chatgpt·ai作画·ai编程·ai写作·agi
孟柯coding3 小时前
教程:在 Windows WSL 中为 Codex 接入 DeepSeek V4 Pro
ai·ai编程
GISer_Jing3 小时前
AI全栈工程师知识体系全景:从前后端核心架构到落地项目全拆解
前端·人工智能·后端·ai编程
Pkmer3 小时前
Java程序员大战Python面向对象
python·ai编程