开源新旗舰 GLM-4.5:不想刷榜,只想干活儿

昨天,AI 圈又迎来一位重量级选手,智谱开源的新一代旗舰模型------GLM-4.5。

我知道,你可能下意识就想说:"哦,又一个?"

这其实不是智谱第一次、第一时间开源自家最先进的大模型了,他们似乎总觉得好东西就该拿出来分享,每次都是掏空"家底儿"式开源。这次更是一口气开源了两个模型:GLM-4.5 和它的"青春版" GLM-4.5-Air,模型权重还是最宽松的 MIT 协议。

GitHub 地址:github.com/zai-org/GLM...

Hugging Face 地址:huggingface.co/zai-org/GLM...

当所有人的目光都还盯着大模型评测排行榜时,智谱却反其道而行之,仿佛在说:"卷排名多累啊,我只想安安静静做个能干活的好同志。"

一、有实力登顶,但更在乎你的体验

要挑战"刷榜"文化,首先得有能上榜的实力。

这次,智谱官方选择了最具代表性的 12 个评测数据集,从 MMLU Pro 到 AIME 24,GLM-4.5 直接斩获全球第三、国产第一、开源第一的成绩。

但智谱的目标并不止于榜单分数。他们坦言:"榜单分数看看就好,真实体验才是王道。" 如今,顶级大模型的跑分差距都不是很大,与其比拼分数,不如拉到真实、复杂的应用场景里一较高下,来得痛快!

为此,智谱团队直接发起了一场硬核"蒙眼乱斗":让 GLM-4.5 与业内顶尖模型(Claude-4-Sonnet、Kimi-K2、Qwen3-Coder)匿名挑战 52 道真实编程任务。

结果显示,GLM-4.5 在开源模型中展现出不俗的竞争力,尤其在工具调用可靠性和任务完成度方面表现突出。虽然与 Claude-4-Sonnet 尚有差距,但在多数场景下已具备"平替"能力。

为保证评测的透明与公正,智谱还开源了全部 52 道题目和 Agent 运行轨迹。

数据集:huggingface.co/datasets/za...

二、用一半资源,做翻倍的事

众所周知,模型越大能力越强,但更高效的工程实力同样重要。GLM-4.5 的卓越表现,正是得益于其工程优化和出色的参数效率。GLM-4.5 系列均采用先进的混合专家(MoE)架构:

  • GLM-4.5 总参数为 355B,激活参数为 32B
  • GLM-4.5-Air 总参数为 106B,激活参数为 12B

GLM-4.5 的总参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,却在多项权威基准测试中表现得更为出色。

如果你是个人开发者,苦于无法运行万亿参数的大模型?不用担心。智谱还提供了远低于主流模型 API 服务的定价:

  • 输入仅 0.8 元/百万 tokens
  • 输出仅 2 元/百万 tokens

这个定价,让个人开发者、初创企业也能毫无压力地使用最前沿的旗舰大模型。接入模型同样非常简单,只需几行代码即可快速上手:

python 复制代码
from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR_API_KEY") # 替换成你的API Key

response = client.chat.completions.create(
    model="glm-4.5",  # 或者 glm-4.5-air
    messages=[
        {"role": "user", "content": "你好,请你帮我写一个 HelloGitHub 网站。"},
    ],
    thinking={"type":"enabled"}
)
print(response.choices[0].message.content)

三、原生智能体,一模多能

说回"干活儿",GLM-4.5 可不是只会聊天的"嘴强王者",而是个正儿八经的"全栈大神"。

GLM-4.5 系列不是仅仅把多个能力简单拼在一起,而是实现了原生智能的深度融合。它在工具调用、网页浏览、软件工程、前端编程等领域都做了专项优化,既兼容 Claude Code 等代码智能体,也支持通过工具调用接口灵活扩展到各种智能体应用。

这种"一模多能"的原生 Agent 能力,让 GLM-4.5 能够胜任从前端 UI 设计、后端数据库管理到复杂的交互动画制作等全栈开发任务。

能用的搜索网站

提示词:做一个 Google 搜索网站。

制作 PPT

提示词:帮我做一份《WAIC Geoffrey Hinton 演讲要点》的 PPT

四、写在最后

GLM-4.5 的发布,不只是又一个强大的开源模型问世,更代表了一种务实、高效、以应用为核心的理念。它不炫耀难懂的技术原理,也不执着于榜单虚名,唯一的目标就是:在你需要它的时候,能让你由衷感叹一句:"真不错,把活儿干完了!"

目前,Z.ai 已经免费开放「满血版 GLM-4.5」,快去体验这个"真正能干活"的强大 AI 帮手吧!

相关推荐
lijianhua_97127 小时前
国内某顶级大学内部用的ai自动生成论文的提示词
人工智能
蔡俊锋7 小时前
用AI实现乐高式大型可插拔系统的技术方案
人工智能·ai工程·ai原子能力·ai乐高工程
自然语7 小时前
人工智能之数字生命 认知架构白皮书 第7章
人工智能·架构
大熊背7 小时前
利用ISP离线模式进行分块LSC校正的方法
人工智能·算法·机器学习
eastyuxiao7 小时前
如何在不同的机器上运行多个OpenClaw实例?
人工智能·git·架构·github·php
诸葛务农7 小时前
AGI 主要技术路径及核心技术:归一融合及未来之路5
大数据·人工智能
光影少年7 小时前
AI Agent智能体开发
人工智能·aigc·ai编程
ai生成式引擎优化技术8 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI生成式引擎(GEO)技术白皮书
人工智能
帐篷Li8 小时前
9Router:开源AI路由网关的架构设计与技术实现深度解析
人工智能
新缸中之脑8 小时前
在GCP上运行autoresearch
人工智能