开源新旗舰 GLM-4.5:不想刷榜,只想干活儿

昨天,AI 圈又迎来一位重量级选手,智谱开源的新一代旗舰模型------GLM-4.5。

我知道,你可能下意识就想说:"哦,又一个?"

这其实不是智谱第一次、第一时间开源自家最先进的大模型了,他们似乎总觉得好东西就该拿出来分享,每次都是掏空"家底儿"式开源。这次更是一口气开源了两个模型:GLM-4.5 和它的"青春版" GLM-4.5-Air,模型权重还是最宽松的 MIT 协议。

GitHub 地址:github.com/zai-org/GLM...

Hugging Face 地址:huggingface.co/zai-org/GLM...

当所有人的目光都还盯着大模型评测排行榜时,智谱却反其道而行之,仿佛在说:"卷排名多累啊,我只想安安静静做个能干活的好同志。"

一、有实力登顶,但更在乎你的体验

要挑战"刷榜"文化,首先得有能上榜的实力。

这次,智谱官方选择了最具代表性的 12 个评测数据集,从 MMLU Pro 到 AIME 24,GLM-4.5 直接斩获全球第三、国产第一、开源第一的成绩。

但智谱的目标并不止于榜单分数。他们坦言:"榜单分数看看就好,真实体验才是王道。" 如今,顶级大模型的跑分差距都不是很大,与其比拼分数,不如拉到真实、复杂的应用场景里一较高下,来得痛快!

为此,智谱团队直接发起了一场硬核"蒙眼乱斗":让 GLM-4.5 与业内顶尖模型(Claude-4-Sonnet、Kimi-K2、Qwen3-Coder)匿名挑战 52 道真实编程任务。

结果显示,GLM-4.5 在开源模型中展现出不俗的竞争力,尤其在工具调用可靠性和任务完成度方面表现突出。虽然与 Claude-4-Sonnet 尚有差距,但在多数场景下已具备"平替"能力。

为保证评测的透明与公正,智谱还开源了全部 52 道题目和 Agent 运行轨迹。

数据集:huggingface.co/datasets/za...

二、用一半资源,做翻倍的事

众所周知,模型越大能力越强,但更高效的工程实力同样重要。GLM-4.5 的卓越表现,正是得益于其工程优化和出色的参数效率。GLM-4.5 系列均采用先进的混合专家(MoE)架构:

  • GLM-4.5 总参数为 355B,激活参数为 32B
  • GLM-4.5-Air 总参数为 106B,激活参数为 12B

GLM-4.5 的总参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,却在多项权威基准测试中表现得更为出色。

如果你是个人开发者,苦于无法运行万亿参数的大模型?不用担心。智谱还提供了远低于主流模型 API 服务的定价:

  • 输入仅 0.8 元/百万 tokens
  • 输出仅 2 元/百万 tokens

这个定价,让个人开发者、初创企业也能毫无压力地使用最前沿的旗舰大模型。接入模型同样非常简单,只需几行代码即可快速上手:

python 复制代码
from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR_API_KEY") # 替换成你的API Key

response = client.chat.completions.create(
    model="glm-4.5",  # 或者 glm-4.5-air
    messages=[
        {"role": "user", "content": "你好,请你帮我写一个 HelloGitHub 网站。"},
    ],
    thinking={"type":"enabled"}
)
print(response.choices[0].message.content)

三、原生智能体,一模多能

说回"干活儿",GLM-4.5 可不是只会聊天的"嘴强王者",而是个正儿八经的"全栈大神"。

GLM-4.5 系列不是仅仅把多个能力简单拼在一起,而是实现了原生智能的深度融合。它在工具调用、网页浏览、软件工程、前端编程等领域都做了专项优化,既兼容 Claude Code 等代码智能体,也支持通过工具调用接口灵活扩展到各种智能体应用。

这种"一模多能"的原生 Agent 能力,让 GLM-4.5 能够胜任从前端 UI 设计、后端数据库管理到复杂的交互动画制作等全栈开发任务。

能用的搜索网站

提示词:做一个 Google 搜索网站。

制作 PPT

提示词:帮我做一份《WAIC Geoffrey Hinton 演讲要点》的 PPT

四、写在最后

GLM-4.5 的发布,不只是又一个强大的开源模型问世,更代表了一种务实、高效、以应用为核心的理念。它不炫耀难懂的技术原理,也不执着于榜单虚名,唯一的目标就是:在你需要它的时候,能让你由衷感叹一句:"真不错,把活儿干完了!"

目前,Z.ai 已经免费开放「满血版 GLM-4.5」,快去体验这个"真正能干活"的强大 AI 帮手吧!

相关推荐
水如烟44 分钟前
孤能子视角:“组织行为学–组织文化“
人工智能
大山同学1 小时前
图片补全-Context Encoder
人工智能·机器学习·计算机视觉
向哆哆1 小时前
打造高校四六级报名管理系统:基于 Flutter × OpenHarmony 的跨端开发实践
flutter·开源·鸿蒙·openharmony·开源鸿蒙
薛定谔的猫19821 小时前
十七、用 GPT2 中文对联模型实现经典上联自动对下联:
人工智能·深度学习·gpt2·大模型 训练 调优
壮Sir不壮1 小时前
2026年奇点:Clawdbot引爆个人AI代理
人工智能·ai·大模型·claude·clawdbot·moltbot·openclaw
PaperRed ai写作降重助手1 小时前
高性价比 AI 论文写作软件推荐:2026 年预算友好型
人工智能·aigc·论文·写作·ai写作·智能降重
玉梅小洋1 小时前
Claude Code 从入门到精通(七):Sub Agent 与 Skill 终极PK
人工智能·ai·大模型·ai编程·claude·ai工具
-嘟囔着拯救世界-2 小时前
【保姆级教程】Win11 下从零部署 Claude Code:本地环境配置 + VSCode 可视化界面全流程指南
人工智能·vscode·ai·编辑器·html5·ai编程·claude code
正见TrueView2 小时前
程一笑的价值选择:AI金玉其外,“收割”老人败絮其中
人工智能
Imm7772 小时前
中国知名的车膜品牌推荐几家
人工智能·python