开源新旗舰 GLM-4.5:不想刷榜,只想干活儿

昨天,AI 圈又迎来一位重量级选手,智谱开源的新一代旗舰模型------GLM-4.5。

我知道,你可能下意识就想说:"哦,又一个?"

这其实不是智谱第一次、第一时间开源自家最先进的大模型了,他们似乎总觉得好东西就该拿出来分享,每次都是掏空"家底儿"式开源。这次更是一口气开源了两个模型:GLM-4.5 和它的"青春版" GLM-4.5-Air,模型权重还是最宽松的 MIT 协议。

GitHub 地址:github.com/zai-org/GLM...

Hugging Face 地址:huggingface.co/zai-org/GLM...

当所有人的目光都还盯着大模型评测排行榜时,智谱却反其道而行之,仿佛在说:"卷排名多累啊,我只想安安静静做个能干活的好同志。"

一、有实力登顶,但更在乎你的体验

要挑战"刷榜"文化,首先得有能上榜的实力。

这次,智谱官方选择了最具代表性的 12 个评测数据集,从 MMLU Pro 到 AIME 24,GLM-4.5 直接斩获全球第三、国产第一、开源第一的成绩。

但智谱的目标并不止于榜单分数。他们坦言:"榜单分数看看就好,真实体验才是王道。" 如今,顶级大模型的跑分差距都不是很大,与其比拼分数,不如拉到真实、复杂的应用场景里一较高下,来得痛快!

为此,智谱团队直接发起了一场硬核"蒙眼乱斗":让 GLM-4.5 与业内顶尖模型(Claude-4-Sonnet、Kimi-K2、Qwen3-Coder)匿名挑战 52 道真实编程任务。

结果显示,GLM-4.5 在开源模型中展现出不俗的竞争力,尤其在工具调用可靠性和任务完成度方面表现突出。虽然与 Claude-4-Sonnet 尚有差距,但在多数场景下已具备"平替"能力。

为保证评测的透明与公正,智谱还开源了全部 52 道题目和 Agent 运行轨迹。

数据集:huggingface.co/datasets/za...

二、用一半资源,做翻倍的事

众所周知,模型越大能力越强,但更高效的工程实力同样重要。GLM-4.5 的卓越表现,正是得益于其工程优化和出色的参数效率。GLM-4.5 系列均采用先进的混合专家(MoE)架构:

  • GLM-4.5 总参数为 355B,激活参数为 32B
  • GLM-4.5-Air 总参数为 106B,激活参数为 12B

GLM-4.5 的总参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,却在多项权威基准测试中表现得更为出色。

如果你是个人开发者,苦于无法运行万亿参数的大模型?不用担心。智谱还提供了远低于主流模型 API 服务的定价:

  • 输入仅 0.8 元/百万 tokens
  • 输出仅 2 元/百万 tokens

这个定价,让个人开发者、初创企业也能毫无压力地使用最前沿的旗舰大模型。接入模型同样非常简单,只需几行代码即可快速上手:

python 复制代码
from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR_API_KEY") # 替换成你的API Key

response = client.chat.completions.create(
    model="glm-4.5",  # 或者 glm-4.5-air
    messages=[
        {"role": "user", "content": "你好,请你帮我写一个 HelloGitHub 网站。"},
    ],
    thinking={"type":"enabled"}
)
print(response.choices[0].message.content)

三、原生智能体,一模多能

说回"干活儿",GLM-4.5 可不是只会聊天的"嘴强王者",而是个正儿八经的"全栈大神"。

GLM-4.5 系列不是仅仅把多个能力简单拼在一起,而是实现了原生智能的深度融合。它在工具调用、网页浏览、软件工程、前端编程等领域都做了专项优化,既兼容 Claude Code 等代码智能体,也支持通过工具调用接口灵活扩展到各种智能体应用。

这种"一模多能"的原生 Agent 能力,让 GLM-4.5 能够胜任从前端 UI 设计、后端数据库管理到复杂的交互动画制作等全栈开发任务。

能用的搜索网站

提示词:做一个 Google 搜索网站。

制作 PPT

提示词:帮我做一份《WAIC Geoffrey Hinton 演讲要点》的 PPT

四、写在最后

GLM-4.5 的发布,不只是又一个强大的开源模型问世,更代表了一种务实、高效、以应用为核心的理念。它不炫耀难懂的技术原理,也不执着于榜单虚名,唯一的目标就是:在你需要它的时候,能让你由衷感叹一句:"真不错,把活儿干完了!"

目前,Z.ai 已经免费开放「满血版 GLM-4.5」,快去体验这个"真正能干活"的强大 AI 帮手吧!

相关推荐
幻风_huanfeng4 分钟前
学习人工智能所需知识体系及路径详解
人工智能·学习
患得患失9499 分钟前
【GitHub Workflows 基础(一)】认识 .github/workflows/ 下的多个工作流
github
云道轩21 分钟前
使用Docker在Rocky Linux 9.5上在线部署LangFlow
linux·人工智能·docker·容器·langflow
木人舟39 分钟前
github copilot接入openai-compatible模型以及去除安全限制的方法
github·copilot
POLOAPI39 分钟前
从模型到生产:AI 大模型落地工程与效率优化实践
人工智能·gpt·gemini
谷歌上搜百度43 分钟前
LLM并非“万能钥匙”——深度解析大语言模型的本质与边界
人工智能·llm
Wendy14411 小时前
【图像掩膜】——图像预处理(OpenCV)
人工智能·opencv·计算机视觉
机器之心1 小时前
开启RL Scaling新纪元,siiRL开源:完全分布式强化学习框架,支持超千卡规模高效训练
人工智能
GISer_Jing1 小时前
Coze:字节跳动AI开发平台功能和架构解析
javascript·人工智能·架构·开源
我有一计3331 小时前
【算法笔记】5.LeetCode-Hot100-矩阵专项
人工智能·算法·程序员