这是苍何的第 439 篇原创!
大家好,我是苍何。
讲真的,最近的AI圈太卷了,卷得我都有点麻了。
你还别说,就这两天,DeepSeek 刚发布 V3.2,我屁股还没坐热,Claude 就甩出了王炸 Claude 4.5。
我以为这就完了,大家都能安心过个节了,结果智谱反手又发布了 GLM-4.6。
昨晚发了文章说 GLM 4.6 要来,但我是真没想到会来这么快。。。

好家伙,我群里直接就炸了,很多小伙伴都说这次提升很大,反响非常不错。

于是我也第一时间体验了下,不吹不黑,确实可以称得上是「国产最强开源Coding模型」。
我甚至用 GLM 4.6 重构了废弃的开源项目,效果很 nice。
不过在 show 我的实测 case 之前,有必要来看看一些官方发布的数据。
在 8 大权威基准模型通用能力的评估测试中,GLM-4.6 在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

在 Claude Code 进行了 74 个真实场景编程任务测试。结果显示,GLM-4.6实测超过 Claude Sonnet 4,超越其他国产模型。

官方放出的数据显示,在 token 消耗上表现也是同类模型的最低。

不过,跑分是一回事,实际效果还得测测,下面来看看我的一些测试 case 吧。
先来个简单的,我们让 GLM 4.6 自己介绍下自己吧。

前端 UI上和 Claude 4 基本没差异,不过这个能力,在 GLM 4.5 表现就还不错,但 4.6 给我的感受是,更快更稳了。
比如让它做一个国庆旅游攻略 PPT,出来的速度更快,质量更高了。

下面让它做个 breakout 游戏,一次就能出来这个效果:

而这个是 Claude 4 出来的效果:

这个 case 明显能看出,GLM 4.6 效果好于 Claude 4 。
GLM 4.6 具备视觉理解能力,于是我直接丢了一张比较抽象的手绘原型图。

它很快就给我复刻出前端界面,效果很给力。

不过对于 Coding 能力的拷打,以上 case 都还勉强算是 demo 级别。
接下来,我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中,让它来做一些更复杂的,更偏向实际开发的一些任务。

PS:Claude Code 2.0 最大的更新是搞了个恢复机制,当 Claude Code 搞砸了,可以运行
/rewind
来撤消代码更改,大家可以更新下。
将将 GLM 4.6 放进 Claude Code 也很简单,一共就这么几步:
第一步,获取智谱 API key

第二步,配置环境变量
打开项目,输入以下配置:
ini
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN=YOUR_API_KEY
第三步,切换使用模型
手动修改配置文件 ~/.claude/settings.json
json
{
"env": {
"ANTHROPIC_MODEL": "glm-4.6"
}
}
这样 CC 的默认使用模型就改为了 GLM 4.6 了。多说一句,现在 GLM 4.6 的 API可以说是羊毛价了,最低一个月 20 就能痛快使用,我反手就冲了个 Pro。

我的第一个任务是让它做一个监控工具,输入一句话需求:
帮我做个小工具:监控'黑神话:悟空'在Steam上的最新评价,并把负面评价整理成markdown。你自己去网上搜一下怎么实现。
然后搭载了 GLM 4.6 的 CC 开始疯狂给我工作,它先是自动取搜索 Straem 评价的 API,然后去搜下如何实现了。

运行这个工具,真的就搜集到了最新的评价,并在我本地文件中做记录了。

整个过程很丝滑, GLM 4.6 帮我自动开发完成了这个工具。
要是以前,光是搜索这种方案,然后再编码就得花费不少时间。
最后一个 case,我是真没想到,我居然通过 GLM 4.6 重构了曾经风靡一时的 GitHub 开源项目 FlexSlider。
这是一款曾经非常非常流行的响应式轮播图/滑块插件。在那个前端框架还没普及的年代,几乎是做轮播图的首选。
它是一个纯粹的 jQuery 插件,代码里充满了典型的上古代码风格。
只是项目已经不维护了,不过很多老项目还在使用。

这个是这个开源项目原本实现的效果:

大家主要看下轮播图,下面,我在 Claude Code 中输入下面一段提示词将它重构为 Vue 的代码。
我现在需要重构下,我希望用Vue来重写,请你帮我重构
可以看到整个重构过程非常丝滑,它先是分析了整个项目,然后开始执行重构操作。

看下重构后的代码,是最新的 Vue3 代码。

然后看下最终轮播图效果,可以说和原先项目效果惊奇的保持了一致。

真的挺麻的,以前重构是一件非常复杂的事情,得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力,居然一次成功了。
好了,今天就到这了。
说实话,最后一个重构的 case 是真的震撼到我了。
重构屎山一样的祖传代码,一直是程序员的噩梦,繁琐、易错,还费时费力。
当 AI 已经能帮你重构祖传代码时,你就应该意识到,它已经从一个「玩具」进化成了一个可以并肩作战的「战友」了。
讲真的,从 GLM-4.6 身上,我看到了国产大模型不再是单纯地追赶和对标,而是真正开始在实用性上发力,切实地为我们开发者解决问题。
这波,我站智谱。