开源新旗舰 GLM-4.5:不想刷榜,只想干活儿

昨天,AI 圈又迎来一位重量级选手,智谱开源的新一代旗舰模型------GLM-4.5。

我知道,你可能下意识就想说:"哦,又一个?"

这其实不是智谱第一次、第一时间开源自家最先进的大模型了,他们似乎总觉得好东西就该拿出来分享,每次都是掏空"家底儿"式开源。这次更是一口气开源了两个模型:GLM-4.5 和它的"青春版" GLM-4.5-Air,模型权重还是最宽松的 MIT 协议。

GitHub 地址:github.com/zai-org/GLM...

Hugging Face 地址:huggingface.co/zai-org/GLM...

当所有人的目光都还盯着大模型评测排行榜时,智谱却反其道而行之,仿佛在说:"卷排名多累啊,我只想安安静静做个能干活的好同志。"

一、有实力登顶,但更在乎你的体验

要挑战"刷榜"文化,首先得有能上榜的实力。

这次,智谱官方选择了最具代表性的 12 个评测数据集,从 MMLU Pro 到 AIME 24,GLM-4.5 直接斩获全球第三、国产第一、开源第一的成绩。

但智谱的目标并不止于榜单分数。他们坦言:"榜单分数看看就好,真实体验才是王道。" 如今,顶级大模型的跑分差距都不是很大,与其比拼分数,不如拉到真实、复杂的应用场景里一较高下,来得痛快!

为此,智谱团队直接发起了一场硬核"蒙眼乱斗":让 GLM-4.5 与业内顶尖模型(Claude-4-Sonnet、Kimi-K2、Qwen3-Coder)匿名挑战 52 道真实编程任务。

结果显示,GLM-4.5 在开源模型中展现出不俗的竞争力,尤其在工具调用可靠性和任务完成度方面表现突出。虽然与 Claude-4-Sonnet 尚有差距,但在多数场景下已具备"平替"能力。

为保证评测的透明与公正,智谱还开源了全部 52 道题目和 Agent 运行轨迹。

数据集:huggingface.co/datasets/za...

二、用一半资源,做翻倍的事

众所周知,模型越大能力越强,但更高效的工程实力同样重要。GLM-4.5 的卓越表现,正是得益于其工程优化和出色的参数效率。GLM-4.5 系列均采用先进的混合专家(MoE)架构:

  • GLM-4.5 总参数为 355B,激活参数为 32B
  • GLM-4.5-Air 总参数为 106B,激活参数为 12B

GLM-4.5 的总参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,却在多项权威基准测试中表现得更为出色。

如果你是个人开发者,苦于无法运行万亿参数的大模型?不用担心。智谱还提供了远低于主流模型 API 服务的定价:

  • 输入仅 0.8 元/百万 tokens
  • 输出仅 2 元/百万 tokens

这个定价,让个人开发者、初创企业也能毫无压力地使用最前沿的旗舰大模型。接入模型同样非常简单,只需几行代码即可快速上手:

python 复制代码
from zhipuai import ZhipuAI

client = ZhipuAI(api_key="YOUR_API_KEY") # 替换成你的API Key

response = client.chat.completions.create(
    model="glm-4.5",  # 或者 glm-4.5-air
    messages=[
        {"role": "user", "content": "你好,请你帮我写一个 HelloGitHub 网站。"},
    ],
    thinking={"type":"enabled"}
)
print(response.choices[0].message.content)

三、原生智能体,一模多能

说回"干活儿",GLM-4.5 可不是只会聊天的"嘴强王者",而是个正儿八经的"全栈大神"。

GLM-4.5 系列不是仅仅把多个能力简单拼在一起,而是实现了原生智能的深度融合。它在工具调用、网页浏览、软件工程、前端编程等领域都做了专项优化,既兼容 Claude Code 等代码智能体,也支持通过工具调用接口灵活扩展到各种智能体应用。

这种"一模多能"的原生 Agent 能力,让 GLM-4.5 能够胜任从前端 UI 设计、后端数据库管理到复杂的交互动画制作等全栈开发任务。

能用的搜索网站

提示词:做一个 Google 搜索网站。

制作 PPT

提示词:帮我做一份《WAIC Geoffrey Hinton 演讲要点》的 PPT

四、写在最后

GLM-4.5 的发布,不只是又一个强大的开源模型问世,更代表了一种务实、高效、以应用为核心的理念。它不炫耀难懂的技术原理,也不执着于榜单虚名,唯一的目标就是:在你需要它的时候,能让你由衷感叹一句:"真不错,把活儿干完了!"

目前,Z.ai 已经免费开放「满血版 GLM-4.5」,快去体验这个"真正能干活"的强大 AI 帮手吧!

相关推荐
好奇龙猫13 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)13 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan13 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维13 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS13 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd14 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟14 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然15 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~15 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1
岁月宁静15 小时前
当 AI 越来越“聪明”,人类真正的护城河是什么:智商、意识与认知主权
人工智能