GLM-4.6:先进的 Agentic、推理和编码能力

都在过年吗??

节前最后一两天都在集中发东西。

看起来deepseek今天春节的成功,大家是都借鉴了。。

2025-09-30 · 研究

转载


今天,我们发布了旗舰模型的最新版本:GLM-4.6。与 GLM-4.5 相比,这一代产品带来了几项关键改进:

  • 更长的上下文窗口: 上下文窗口从 128K 扩展到 200K tokens,使模型能够处理更复杂的 agentic 任务。
  • 卓越的编码性能: 该模型在代码基准测试中获得更高分数,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用中展现出更好的实际表现,包括在生成视觉精美的前端页面方面的改进。
  • 高级推理: GLM-4.6 在推理性能上显示出明显改进,并支持推理期间的工具使用,从而带来更强的整体能力。
  • 更强大的 agents: GLM-4.6 在工具使用和基于搜索的 agents 方面表现出更强的性能,并在 agent 框架中更有效地集成。
  • 精炼的写作: 在风格和可读性方面更好地符合人类偏好,并在角色扮演场景中表现得更加自然。

我们在涵盖 agents、推理和编码的八个公共基准测试中对 GLM-4.6 进行了评估。结果显示,相比 GLM-4.5 有明显提升,GLM-4.6 相对于 DeepSeek-V3.2-ExpClaude Sonnet 4 等国内外领先模型也具有竞争优势,但在编码能力方面仍落后于 Claude Sonnet 4.5。

实际体验比排行榜更重要。我们在 GLM-4.5 的基础上扩展了 CC-Bench ,增加了更具挑战性的任务,人类评估员在隔离的 Docker 容器中与模型协作,完成跨前端开发、工具构建、数据分析、测试和算法的多轮实际任务。GLM-4.6 在 GLM-4.5 基础上有所改进,与 Claude Sonnet 4 接近持平(48.6% 胜率),同时明显优于其他开源基线。

从 token 效率角度来看,GLM-4.6 完成任务所需的 tokens 比 GLM-4.5 少约 15%,显示出能力和效率的双重提升。

开始使用

Z.ai API 平台调用 GLM-4.6 API

Z.ai API 平台提供 GLM-4.6 和 GLM-4.6-Air 两种模型。有关全面的 API 文档和集成指南,请参阅 docs.z.ai/guides/llm/... OpenRouter 访问这两个模型。

将 GLM-4.6 与编码 Agents 配合使用

GLM-4.6 现已可在编码 agents(Claude Code、Kilo Code、Roo Code、Cline 等)中使用。

对于 GLM Coding Plan 订阅用户 :您将自动升级到 GLM-4.6。如果您之前自定义过应用配置(如 Claude Code 中的 ~/.claude/settings.json),只需将模型名称更新为 "glm-4.6" 即可完成升级。

对于新用户 :GLM Coding Plan 以 1/7 的价格提供 Claude 级别的性能,并提供 3 倍的使用配额。立即开始构建:z.ai/subscribe。

Z.ai 上与 GLM-4.6 聊天

通过选择 GLM-4.6 模型选项,可以在 Z.ai 上访问 GLM-4.6。

本地部署 GLM-4.6

GLM-4.5 和 GLM-4.5-Air 的基础版本和对话版本的模型权重在 HuggingFace 和 ModelScope 上公开可用。对于本地部署,GLM-4.5 支持包括 vLLM 在内的推理框架。

相关推荐
蛋先生DX1 天前
RAG 切片利器 LumberChunker 是如何智能地把文档切割成 LLM 爱吃的块
llm·aigc·ai编程
腾讯云云开发1 天前
Gemini CLI接入CloudBase-AI-Toolkit(MCP)保姆级教程
ai编程·小程序·云开发·gemini
木建隶1 天前
AI 食用指南--更好的用AI编程
人工智能·ai编程
飞哥数智坊1 天前
Claude Skills 实测体验:不用翻墙,GLM-4.6 也能玩转
人工智能·claude·chatglm (智谱)
Aitter1 天前
PDF和Word文件转换为Markdown的技术实现
前端·ai编程
Costrict2 天前
解锁新阵地!CoStrict 现已支持 JetBrains 系列 IDE
大数据·ide·人工智能·深度学习·自然语言处理·ai编程·visual studio
zybsjn2 天前
MCP传输模式选择指南:Stdio与HTTP的终极对比
ai编程
腾讯云云开发2 天前
云开发CloudBase AI+实战:快速搭建AI小程序全流程指南
agent·ai编程·小程序·云开发
用户4099322502122 天前
PostgreSQL全表扫描慢到崩溃?建索引+改查询+更统计信息三招能破?
后端·ai编程·trae
rengang662 天前
软件工程新纪元:AI协同编程架构师的修养与使命
人工智能·软件工程·ai编程·ai协同编程架构师