硅谷青睐的中国模型更新了!一觉醒来,直接套壳

「【新智元导读】智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型 GLM-4.7 并开源!」

2025 年底智谱压轴了,还是一炮双响!

一份招股书冲刺「大模型第一股」,紧跟着发布了最新一代开源大模型 GLM-4.7!

经过一年的狂飙突进后,智谱用一场资本和科技完美共振的盛宴收官了。

GLM-4.7 这次以「Coding」能力提升为核心定位,直接对标全球顶尖编程模型 Claude Sonnet 4.5,在多个权威榜单上不仅拿下了开源第一,更实现了国产模型对硅谷顶尖闭源模型的贴身肉搏。

这一战绩在 Vals Index 上体现得淋漓尽致。

作为一个不仅考量代码能力,还加权了金融、法律等高价值复杂任务的权威榜单,Vals Index 向来被视为大模型「经济价值」的风向标。

GLM-4.7 在这里出道即巅峰,直接空降开源模型**「第一名!」**

这意味着,在一个不论出身、只论实力的竞技场里,它把一众知名的欧美开源模型甩在了身后,证明了开源模型在处理高难度、高价值任务上,已经具备了替代闭源巨头的实力。

而在更能反映开发者真实体感的 Design Arena 中,GLM-4.7 的表现则更具戏剧性。

由开发者盲测投票得出的胜率(Win Rate)和 Elo 评分中,「GLM-4.7 高居第二,紧紧咬住了谷歌的 Gemini 3 Pro Preview,甚至超过了 Claude Opus 4.5 和 GPT-5.2。」

与此同时,在代码竞技场 WebDev 中,GLM-4.7 更是直接斩获开源第一,跻身全球第六。

高耸的柱状图不只是数字,它是全球开发者用脚投票的结果:在高强度的实战对比中,人们更愿意使用 GLM-4.7。

这标志着国产模型终于跨越了从「能用」到「好用」、从「参数对齐」到「体验对齐」的那道天堑。

在 2025 年的大部分时间里,Anthropic 的 Claude 系列,特别是 Claude Opus 4.5,一直被全球开发者奉为「编程之神」。

但是 GLM-4.7 的发布,选择了正面硬刚 Claude,对这波操作最开心的,莫过于大洋彼岸的硅谷程序员们了。

他们一觉醒来惊喜地发现:中国开源界又「送温暖」了! 这次不仅有现成的新模型可以「套壳」,性能还强得离谱。

这大概就是 2025 年 AI 圈魔幻的乐子:美国的编程工具,都等着中国发模型。

「被老外套壳的中国大模型」

「又更新了~」

GLM 上次火出圈,还是因为 Cursor、Windsurf 的「自研模型」被发现其实是套的 GLM 的壳。

要知道,Cursor 的市值加起来比两个智谱都高,结果基座模型还是用的咱们国产的。

这一次,GLM-4.7 更新,大洋彼岸的美国明星科技企业直接不藏了!

备受海外用户欢迎的 Cline、Kilo、Vercel 等一众主流 AI 平台,纷纷在第一时间官宣接入,并对其取得的巨大进步高度评价。

估值 40 亿美元的 Fireworks 同样发电 Day0 支持------美国人民有更好的模型可以用了!

「为何老外偏爱「中国开源模型」」

硅谷的精明,在于「不看广告看疗效」。

他们选择 GLM 等开源模型,无非是因为它不仅**「便宜」,而且「真的好用」**。

毕竟,相比于昂贵的 GPT 和 Claude 系列,GLM 提供了几乎同等的 Coding 能力,但成本极低。

对于需要大量消耗 Token 的 Agent 工具来说,GLM 是极佳的「降本增效」引擎。

「不止于美国,智谱目前已在海外拥有超过 15 万用户,因而每次发布新模型,都备受海外开发者关注。」

智谱 Coding Plan 的全球化人群分布

而且老外对于 GLM 的热情不仅仅是开源免费,能打才是核心因素。

「「体感」拉满,歪果网友又玩疯了」

AI Coding 因为涉及到「抽卡」(通过多次重复来得到满意的输出),所以很多展示出来 Demo 到底是对话几轮以后的结果,很难说清楚。

因而,开发者的使用「体感」很能说明问题。

GLM 每次一发布,国外的论坛就集体高潮,有赞扬的,有质疑的,但都表现出极大的热情。

比如有人认为上一个版本 GLM-4.6 就已经接近 Claude 的 4.5,而且要比 4.0 更好。

甚至还有外国老哥认为 GLM-5 会直接问鼎 SOTA!

国外的著名 KOL 们也开始自来水的推荐。

上下滑动查看

甚至有老哥看了 GLM 的价格,直接决定先买 1 年的服务!

让我们来看看,一向脑洞大开的国外网友能用 GLM-4.7 玩出什么花吧。

做个小游戏,不在话下。

Agentic 能力的核心「工具调用」,完成得非常出色。

做个看起来酷炫的网页,也是信手拈来。

「理综」考试(多任务集合),顺利通过!

官方搓出来的「植物大战僵尸」更是惊艳。

「小测一下」

正如前文所说,目前主流的编程工具,如 Claude Code、Cursor、Cline 等等,都能完美支持 GLM-4.7 的部署。

以最火热的 Claude Code 为例,智谱在官方文档中给出了特别详细的逐步教程(docs.bigmodel.cn/cn/coding-p...

进入命令行界面,执行如下运行 Coding Tool Helper:

bash 复制代码
npx @z_ai/coding-helper

一键式配齐 API 等环境参数后,重启 Terminal,输入 claude,即可在 Claude Code 中使用 GLM-4.7 开启你愉快的 vibe coding 了!

直接给出提示词:

设计一个细节丰富的体素风格(voxel-art)场景,核心要是在一座生机勃勃的花园里放一座华丽的宝塔。植物种类要多------特别是樱花树,一定要多来点------确保整体画面看起来生动活泼、色彩鲜艳,而且视觉冲击力要强。随便你用什么体素或者 WebGL 库都行,但最后给我的必须是一个独立的 HTML 文件,让我能直接粘贴代码然后在 Chrome 浏览器里打开看。

很快,Gemini 3 Pro 就交卷了。

除了宝塔有点歪之外,效果还不错。

GLM-4.7 给出的效果,有点子惊喜。

除了宝塔、小溪、草地,以及一大片樱花树之外,还有满天飞舞的花瓣。

更有意思的是,它还自己设计了一键自动旋转画面的功能,沉浸感直接拉满。

而且,网页版还能实时渲染代码,非常方便。

第二段提示词:

1 帮我做一个技能五子棋的游戏网页,要求是在普通的五子棋规则上,玩家可以使用技能,其中包括飞沙走石,静如止水,力拔山兮。「飞沙走石」,是把对手的棋子直接扔进什(石)刹海,2 技能点;「静如止水」是凝结时间,把对方「速冻」,4 技能点;「力拔山兮」是摔坏棋盘, 8 技能点,直接获胜。黑棋和白棋的技能点要分开算,并且每走一步都可以累加。直接给我 HTML 文件,画面要美观。需要设计一个电脑对手,让我可以直接和它对战。

GLM-4.7 设计的这个「AI」简直绝了,主打一个「五五开」。

首场惨败之后瞬间上头,反手就是三连局,根本停不下来......

再来一个更厉害的!

首先,输入如下提示词:

请用 HTML、CSS 和 JS 做一个浏览器操作系统,要求包含下面这些功能:

  • 至少有 5 个 App;
  • 这 5 个 App 里,必须有两个是真的能玩的游戏;
  • 支持更换壁纸;
  • 再加一个你自己定的「特殊」功能,你得说明白这个功能是啥,以及它特别在哪里。

然后,直接看效果:

视频详情

想当初,让 AI 写个能玩的贪吃蛇都费劲。

现在,只需要一小段 Prompt,不仅能一口气生成 5 个能玩的应用,甚至还能搞出一个「操作系统」。

归根结底,AGI 是一场长跑,跑分只是评估性能的一种方式。

虽然指标提供了必要的参考,但最重要的始终是「体感」。

真正的智能,不仅仅在于考试拿满分或数据处理得更快,还在于它能否无缝地融入我们的工作流与生活。

而这一次,它融入的是「编程」。

参考资料:

GLM-4.7 上线并开源:更强的编码

相关推荐
啊阿狸不会拉杆几秒前
《机器学习导论》第 1 章 - 引言
人工智能·python·算法·机器学习·ai·numpy·matplotlib
coldstarry1 分钟前
sheng的学习笔记-AI-adaboost(Adaptive Boosting)
人工智能·笔记·学习
KG_LLM图谱增强大模型1 分钟前
Graph-O1:基于蒙特卡洛树搜索与强化学习的文本属性图推理框架
人工智能·知识图谱
北京青翼科技1 分钟前
高速采集卡丨AD 采集丨 多通道数据采集卡丨高速数据采集系统丨青翼科技FMC 子卡
图像处理·人工智能·fpga开发·信号处理·智能硬件
轻轻唱3 分钟前
2026专业PPT设计服务商推荐:TOP10深度评测与选择指南
大数据·人工智能·算法
众趣科技5 分钟前
前馈神经网络入门:空间计算的三维重建魔法
人工智能·神经网络·空间计算
张人玉5 分钟前
VisionPro Blob、条码识别、OCR 核心学习笔记
人工智能·机器学习·计算机视觉·vsionpro
ws2019076 分钟前
AI重塑第三空间,AUTO TECH China 2026广州汽车智能座舱展解锁产业升级新密码
人工智能·科技·汽车
fanstuck8 分钟前
从 0 到 1 构建企业智能体平台:openJiuwen 架构解析与智能客服工作流实战
大数据·人工智能·算法·架构·aigc
Coovally AI模型快速验证9 分钟前
“看起来像世界”≠“真世界”!WorldLens全维度解构自动驾驶世界模型
人工智能·机器学习·计算机视觉·目标跟踪·自动驾驶·ocr