硅谷青睐的中国模型更新了!一觉醒来,直接套壳

「【新智元导读】智谱作为「大模型第一股」赴港上市前夕,直接掏出了旗舰模型 GLM-4.7 并开源!」

2025 年底智谱压轴了,还是一炮双响!

一份招股书冲刺「大模型第一股」,紧跟着发布了最新一代开源大模型 GLM-4.7!

经过一年的狂飙突进后,智谱用一场资本和科技完美共振的盛宴收官了。

GLM-4.7 这次以「Coding」能力提升为核心定位,直接对标全球顶尖编程模型 Claude Sonnet 4.5,在多个权威榜单上不仅拿下了开源第一,更实现了国产模型对硅谷顶尖闭源模型的贴身肉搏。

这一战绩在 Vals Index 上体现得淋漓尽致。

作为一个不仅考量代码能力,还加权了金融、法律等高价值复杂任务的权威榜单,Vals Index 向来被视为大模型「经济价值」的风向标。

GLM-4.7 在这里出道即巅峰,直接空降开源模型**「第一名!」**

这意味着,在一个不论出身、只论实力的竞技场里,它把一众知名的欧美开源模型甩在了身后,证明了开源模型在处理高难度、高价值任务上,已经具备了替代闭源巨头的实力。

而在更能反映开发者真实体感的 Design Arena 中,GLM-4.7 的表现则更具戏剧性。

由开发者盲测投票得出的胜率(Win Rate)和 Elo 评分中,「GLM-4.7 高居第二,紧紧咬住了谷歌的 Gemini 3 Pro Preview,甚至超过了 Claude Opus 4.5 和 GPT-5.2。」

与此同时,在代码竞技场 WebDev 中,GLM-4.7 更是直接斩获开源第一,跻身全球第六。

高耸的柱状图不只是数字,它是全球开发者用脚投票的结果:在高强度的实战对比中,人们更愿意使用 GLM-4.7。

这标志着国产模型终于跨越了从「能用」到「好用」、从「参数对齐」到「体验对齐」的那道天堑。

在 2025 年的大部分时间里,Anthropic 的 Claude 系列,特别是 Claude Opus 4.5,一直被全球开发者奉为「编程之神」。

但是 GLM-4.7 的发布,选择了正面硬刚 Claude,对这波操作最开心的,莫过于大洋彼岸的硅谷程序员们了。

他们一觉醒来惊喜地发现:中国开源界又「送温暖」了! 这次不仅有现成的新模型可以「套壳」,性能还强得离谱。

这大概就是 2025 年 AI 圈魔幻的乐子:美国的编程工具,都等着中国发模型。

「被老外套壳的中国大模型」

「又更新了~」

GLM 上次火出圈,还是因为 Cursor、Windsurf 的「自研模型」被发现其实是套的 GLM 的壳。

要知道,Cursor 的市值加起来比两个智谱都高,结果基座模型还是用的咱们国产的。

这一次,GLM-4.7 更新,大洋彼岸的美国明星科技企业直接不藏了!

备受海外用户欢迎的 Cline、Kilo、Vercel 等一众主流 AI 平台,纷纷在第一时间官宣接入,并对其取得的巨大进步高度评价。

估值 40 亿美元的 Fireworks 同样发电 Day0 支持------美国人民有更好的模型可以用了!

「为何老外偏爱「中国开源模型」」

硅谷的精明,在于「不看广告看疗效」。

他们选择 GLM 等开源模型,无非是因为它不仅**「便宜」,而且「真的好用」**。

毕竟,相比于昂贵的 GPT 和 Claude 系列,GLM 提供了几乎同等的 Coding 能力,但成本极低。

对于需要大量消耗 Token 的 Agent 工具来说,GLM 是极佳的「降本增效」引擎。

「不止于美国,智谱目前已在海外拥有超过 15 万用户,因而每次发布新模型,都备受海外开发者关注。」

智谱 Coding Plan 的全球化人群分布

而且老外对于 GLM 的热情不仅仅是开源免费,能打才是核心因素。

「「体感」拉满,歪果网友又玩疯了」

AI Coding 因为涉及到「抽卡」(通过多次重复来得到满意的输出),所以很多展示出来 Demo 到底是对话几轮以后的结果,很难说清楚。

因而,开发者的使用「体感」很能说明问题。

GLM 每次一发布,国外的论坛就集体高潮,有赞扬的,有质疑的,但都表现出极大的热情。

比如有人认为上一个版本 GLM-4.6 就已经接近 Claude 的 4.5,而且要比 4.0 更好。

甚至还有外国老哥认为 GLM-5 会直接问鼎 SOTA!

国外的著名 KOL 们也开始自来水的推荐。

上下滑动查看

甚至有老哥看了 GLM 的价格,直接决定先买 1 年的服务!

让我们来看看,一向脑洞大开的国外网友能用 GLM-4.7 玩出什么花吧。

做个小游戏,不在话下。

Agentic 能力的核心「工具调用」,完成得非常出色。

做个看起来酷炫的网页,也是信手拈来。

「理综」考试(多任务集合),顺利通过!

官方搓出来的「植物大战僵尸」更是惊艳。

「小测一下」

正如前文所说,目前主流的编程工具,如 Claude Code、Cursor、Cline 等等,都能完美支持 GLM-4.7 的部署。

以最火热的 Claude Code 为例,智谱在官方文档中给出了特别详细的逐步教程(docs.bigmodel.cn/cn/coding-p...

进入命令行界面,执行如下运行 Coding Tool Helper:

bash 复制代码
npx @z_ai/coding-helper

一键式配齐 API 等环境参数后,重启 Terminal,输入 claude,即可在 Claude Code 中使用 GLM-4.7 开启你愉快的 vibe coding 了!

直接给出提示词:

设计一个细节丰富的体素风格(voxel-art)场景,核心要是在一座生机勃勃的花园里放一座华丽的宝塔。植物种类要多------特别是樱花树,一定要多来点------确保整体画面看起来生动活泼、色彩鲜艳,而且视觉冲击力要强。随便你用什么体素或者 WebGL 库都行,但最后给我的必须是一个独立的 HTML 文件,让我能直接粘贴代码然后在 Chrome 浏览器里打开看。

很快,Gemini 3 Pro 就交卷了。

除了宝塔有点歪之外,效果还不错。

GLM-4.7 给出的效果,有点子惊喜。

除了宝塔、小溪、草地,以及一大片樱花树之外,还有满天飞舞的花瓣。

更有意思的是,它还自己设计了一键自动旋转画面的功能,沉浸感直接拉满。

而且,网页版还能实时渲染代码,非常方便。

第二段提示词:

1 帮我做一个技能五子棋的游戏网页,要求是在普通的五子棋规则上,玩家可以使用技能,其中包括飞沙走石,静如止水,力拔山兮。「飞沙走石」,是把对手的棋子直接扔进什(石)刹海,2 技能点;「静如止水」是凝结时间,把对方「速冻」,4 技能点;「力拔山兮」是摔坏棋盘, 8 技能点,直接获胜。黑棋和白棋的技能点要分开算,并且每走一步都可以累加。直接给我 HTML 文件,画面要美观。需要设计一个电脑对手,让我可以直接和它对战。

GLM-4.7 设计的这个「AI」简直绝了,主打一个「五五开」。

首场惨败之后瞬间上头,反手就是三连局,根本停不下来......

再来一个更厉害的!

首先,输入如下提示词:

请用 HTML、CSS 和 JS 做一个浏览器操作系统,要求包含下面这些功能:

  • 至少有 5 个 App;
  • 这 5 个 App 里,必须有两个是真的能玩的游戏;
  • 支持更换壁纸;
  • 再加一个你自己定的「特殊」功能,你得说明白这个功能是啥,以及它特别在哪里。

然后,直接看效果:

视频详情

想当初,让 AI 写个能玩的贪吃蛇都费劲。

现在,只需要一小段 Prompt,不仅能一口气生成 5 个能玩的应用,甚至还能搞出一个「操作系统」。

归根结底,AGI 是一场长跑,跑分只是评估性能的一种方式。

虽然指标提供了必要的参考,但最重要的始终是「体感」。

真正的智能,不仅仅在于考试拿满分或数据处理得更快,还在于它能否无缝地融入我们的工作流与生活。

而这一次,它融入的是「编程」。

参考资料:

GLM-4.7 上线并开源:更强的编码

相关推荐
机器之心2 小时前
无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%
人工智能·openai
科技云报道2 小时前
科技云报到:2026网络安全六大新趋势:AI重构攻防,信任成为新防线
人工智能·科技·web安全
机器之心2 小时前
微软定目标:2030年,彻底删除C、C++代码,换成Rust
人工智能·openai
新智元2 小时前
超越谷歌,全球第一!上交 AI 科学家王者归来,登顶 OpenAI MLE-bench
人工智能·openai
北京耐用通信2 小时前
告别“蜘蛛网”接线!耐达讯自动化PROFIBUS 三路集线器让气缸布线“一拖三”的神操作
人工智能·物联网·网络协议·自动化·信息与通信
Coder_Boy_2 小时前
基于DDD+Spring Boot 3.2+LangChain4j构建企业级智能客服系统
java·人工智能·spring boot·后端
持续学习的程序员+13 小时前
RLinf强化学习框架试用
人工智能
创客匠人老蒋3 小时前
AI不是工具,而是新商业模式的操作系统:创客引领数智化转型
人工智能·创客匠人·知识变现·创客匠人全球ip+ai高峰论坛·全球创始人ip+ai万人峰会
Yeats_Liao3 小时前
MindSpore开发之路(十):构建卷积神经网络(CNN):核心层详解
人工智能·神经网络·cnn