国产最强开源Coding模型发布了!!

这是苍何的第 439 篇原创!

大家好,我是苍何。

讲真的,最近的AI圈太卷了,卷得我都有点麻了。

你还别说,就这两天,DeepSeek 刚发布 V3.2,我屁股还没坐热,Claude 就甩出了王炸 Claude 4.5。

我以为这就完了,大家都能安心过个节了,结果智谱反手又发布了 GLM-4.6。

昨晚发了文章说 GLM 4.6 要来,但我是真没想到会来这么快。。。

好家伙,我群里直接就炸了,很多小伙伴都说这次提升很大,反响非常不错。

于是我也第一时间体验了下,不吹不黑,确实可以称得上是「国产最强开源Coding模型」。

我甚至用 GLM 4.6 重构了废弃的开源项目,效果很 nice。

不过在 show 我的实测 case 之前,有必要来看看一些官方发布的数据。

在 8 大权威基准模型通用能力的评估测试中,GLM-4.6 在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

在 Claude Code 进行了 74 个真实场景编程任务测试。结果显示,GLM-4.6实测超过 Claude Sonnet 4,超越其他国产模型。

官方放出的数据显示,在 token 消耗上表现也是同类模型的最低。

不过,跑分是一回事,实际效果还得测测,下面来看看我的一些测试 case 吧。

先来个简单的,我们让 GLM 4.6 自己介绍下自己吧。

前端 UI上和 Claude 4 基本没差异,不过这个能力,在 GLM 4.5 表现就还不错,但 4.6 给我的感受是,更快更稳了

比如让它做一个国庆旅游攻略 PPT,出来的速度更快,质量更高了。

下面让它做个 breakout 游戏,一次就能出来这个效果:

而这个是 Claude 4 出来的效果:

这个 case 明显能看出,GLM 4.6 效果好于 Claude 4 。

GLM 4.6 具备视觉理解能力,于是我直接丢了一张比较抽象的手绘原型图。

它很快就给我复刻出前端界面,效果很给力。

不过对于 Coding 能力的拷打,以上 case 都还勉强算是 demo 级别。

接下来,我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中,让它来做一些更复杂的,更偏向实际开发的一些任务。

PS:Claude Code 2.0 最大的更新是搞了个恢复机制,当 Claude Code 搞砸了,可以运行 /rewind 来撤消代码更改,大家可以更新下。

将将 GLM 4.6 放进 Claude Code 也很简单,一共就这么几步:

第一步,获取智谱 API key

第二步,配置环境变量

打开项目,输入以下配置:

ini 复制代码
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic

export ANTHROPIC_AUTH_TOKEN=YOUR_API_KEY

第三步,切换使用模型

手动修改配置文件 ~/.claude/settings.json

json 复制代码
{
"env": {
"ANTHROPIC_MODEL": "glm-4.6"
  }
}

这样 CC 的默认使用模型就改为了 GLM 4.6 了。多说一句,现在 GLM 4.6 的 API可以说是羊毛价了,最低一个月 20 就能痛快使用,我反手就冲了个 Pro。

我的第一个任务是让它做一个监控工具,输入一句话需求:

帮我做个小工具:监控'黑神话:悟空'在Steam上的最新评价,并把负面评价整理成markdown。你自己去网上搜一下怎么实现。

然后搭载了 GLM 4.6 的 CC 开始疯狂给我工作,它先是自动取搜索 Straem 评价的 API,然后去搜下如何实现了。

运行这个工具,真的就搜集到了最新的评价,并在我本地文件中做记录了。

整个过程很丝滑, GLM 4.6 帮我自动开发完成了这个工具。

要是以前,光是搜索这种方案,然后再编码就得花费不少时间。

最后一个 case,我是真没想到,我居然通过 GLM 4.6 重构了曾经风靡一时的 GitHub 开源项目 FlexSlider。

这是一款曾经非常非常流行的响应式轮播图/滑块插件。在那个前端框架还没普及的年代,几乎是做轮播图的首选。

它是一个纯粹的 jQuery 插件,代码里充满了典型的上古代码风格。

只是项目已经不维护了,不过很多老项目还在使用。

这个是这个开源项目原本实现的效果:

大家主要看下轮播图,下面,我在 Claude Code 中输入下面一段提示词将它重构为 Vue 的代码。

我现在需要重构下,我希望用Vue来重写,请你帮我重构

可以看到整个重构过程非常丝滑,它先是分析了整个项目,然后开始执行重构操作。

看下重构后的代码,是最新的 Vue3 代码。

然后看下最终轮播图效果,可以说和原先项目效果惊奇的保持了一致。

真的挺麻的,以前重构是一件非常复杂的事情,得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力,居然一次成功了。

好了,今天就到这了。

说实话,最后一个重构的 case 是真的震撼到我了。

重构屎山一样的祖传代码,一直是程序员的噩梦,繁琐、易错,还费时费力。

当 AI 已经能帮你重构祖传代码时,你就应该意识到,它已经从一个「玩具」进化成了一个可以并肩作战的「战友」了。

讲真的,从 GLM-4.6 身上,我看到了国产大模型不再是单纯地追赶和对标,而是真正开始在实用性上发力,切实地为我们开发者解决问题。

这波,我站智谱。

相关推荐
机器之心1 天前
李飞飞最新长文:AI的下一个十年——构建真正具备空间智能的机器
人工智能·openai
机器之心1 天前
豆包编程模型来了,我们用四个关卡考了考它!
人工智能·openai
阿里云大数据AI技术1 天前
让 ETL 更懂语义:DataWorks 支持数据集成 AI 辅助处理能力
人工智能·阿里云·dataworks·ai辅助
hoiii1871 天前
基于交替方向乘子法(ADMM)的RPCA MATLAB实现
人工智能·算法·matlab
Elastic 中国社区官方博客1 天前
Elasticsearch:如何为 Elastic Stack 部署 E5 模型 - 下载及隔离环境
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
xier_ran1 天前
深度学习:神经网络中的参数和超参数
人工智能·深度学习
8Qi81 天前
伪装图像生成之——GAN与Diffusion
人工智能·深度学习·神经网络·生成对抗网络·图像生成·伪装图像生成
阿里云大数据AI技术1 天前
PAI Physical AI Notebook详解2:基于Cosmos世界模型的操作动作数据扩增与模仿学习
人工智能
傻啦嘿哟1 天前
Python高效实现Word转HTML:从基础到进阶的全流程方案
人工智能·python·tensorflow
该用户已不存在1 天前
Gemini CLI 核心命令指南,让工作从从容容游刃有余
人工智能·程序员·aigc