GLM-4.6:先进的 Agentic、推理和编码能力

都在过年吗??

节前最后一两天都在集中发东西。

看起来deepseek今天春节的成功,大家是都借鉴了。。

2025-09-30 · 研究

转载


今天,我们发布了旗舰模型的最新版本:GLM-4.6。与 GLM-4.5 相比,这一代产品带来了几项关键改进:

  • 更长的上下文窗口: 上下文窗口从 128K 扩展到 200K tokens,使模型能够处理更复杂的 agentic 任务。
  • 卓越的编码性能: 该模型在代码基准测试中获得更高分数,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用中展现出更好的实际表现,包括在生成视觉精美的前端页面方面的改进。
  • 高级推理: GLM-4.6 在推理性能上显示出明显改进,并支持推理期间的工具使用,从而带来更强的整体能力。
  • 更强大的 agents: GLM-4.6 在工具使用和基于搜索的 agents 方面表现出更强的性能,并在 agent 框架中更有效地集成。
  • 精炼的写作: 在风格和可读性方面更好地符合人类偏好,并在角色扮演场景中表现得更加自然。

我们在涵盖 agents、推理和编码的八个公共基准测试中对 GLM-4.6 进行了评估。结果显示,相比 GLM-4.5 有明显提升,GLM-4.6 相对于 DeepSeek-V3.2-ExpClaude Sonnet 4 等国内外领先模型也具有竞争优势,但在编码能力方面仍落后于 Claude Sonnet 4.5。

实际体验比排行榜更重要。我们在 GLM-4.5 的基础上扩展了 CC-Bench ,增加了更具挑战性的任务,人类评估员在隔离的 Docker 容器中与模型协作,完成跨前端开发、工具构建、数据分析、测试和算法的多轮实际任务。GLM-4.6 在 GLM-4.5 基础上有所改进,与 Claude Sonnet 4 接近持平(48.6% 胜率),同时明显优于其他开源基线。

从 token 效率角度来看,GLM-4.6 完成任务所需的 tokens 比 GLM-4.5 少约 15%,显示出能力和效率的双重提升。

开始使用

Z.ai API 平台调用 GLM-4.6 API

Z.ai API 平台提供 GLM-4.6 和 GLM-4.6-Air 两种模型。有关全面的 API 文档和集成指南,请参阅 docs.z.ai/guides/llm/... OpenRouter 访问这两个模型。

将 GLM-4.6 与编码 Agents 配合使用

GLM-4.6 现已可在编码 agents(Claude Code、Kilo Code、Roo Code、Cline 等)中使用。

对于 GLM Coding Plan 订阅用户 :您将自动升级到 GLM-4.6。如果您之前自定义过应用配置(如 Claude Code 中的 ~/.claude/settings.json),只需将模型名称更新为 "glm-4.6" 即可完成升级。

对于新用户 :GLM Coding Plan 以 1/7 的价格提供 Claude 级别的性能,并提供 3 倍的使用配额。立即开始构建:z.ai/subscribe。

Z.ai 上与 GLM-4.6 聊天

通过选择 GLM-4.6 模型选项,可以在 Z.ai 上访问 GLM-4.6。

本地部署 GLM-4.6

GLM-4.5 和 GLM-4.5-Air 的基础版本和对话版本的模型权重在 HuggingFace 和 ModelScope 上公开可用。对于本地部署,GLM-4.5 支持包括 vLLM 在内的推理框架。

相关推荐
牛奶13 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶13 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
KEEN的创享空间19 小时前
AI编程从0到1之10X提效(Vibe Coding 氛围式编码 )09篇
openai·ai编程
AlienZHOU20 小时前
为 AI Agent 编写高质量 Skill:Claude 官方指南
agent·ai编程·claude
恋猫de小郭20 小时前
移动端开发稳了?AI 目前还无法取代客户端开发,小红书的论文告诉你数据
前端·flutter·ai编程
KaneLogger21 小时前
【翻译】打造 Agent Skills 的最佳实践
agent·ai编程·claude
王小酱21 小时前
Everything Claude Code 文档
openai·ai编程·aiops
雮尘1 天前
如何在非 Claude IDE (TARE、 Cursor、Antigravity 等)下使用 Agent Skills
前端·agent·ai编程
刘贺同学1 天前
Day12-龙虾哥打工日记:OpenClaw 子 Agent 到底看到了什么?
aigc·ai编程
程序员鱼皮1 天前
离大谱,我竟然在 VS Code 里做了个视频!
github·aigc·ai编程