国产最强开源Coding模型发布了!!

这是苍何的第 439 篇原创!

大家好,我是苍何。

讲真的,最近的AI圈太卷了,卷得我都有点麻了。

你还别说,就这两天,DeepSeek 刚发布 V3.2,我屁股还没坐热,Claude 就甩出了王炸 Claude 4.5。

我以为这就完了,大家都能安心过个节了,结果智谱反手又发布了 GLM-4.6。

昨晚发了文章说 GLM 4.6 要来,但我是真没想到会来这么快。。。

好家伙,我群里直接就炸了,很多小伙伴都说这次提升很大,反响非常不错。

于是我也第一时间体验了下,不吹不黑,确实可以称得上是「国产最强开源Coding模型」。

我甚至用 GLM 4.6 重构了废弃的开源项目,效果很 nice。

不过在 show 我的实测 case 之前,有必要来看看一些官方发布的数据。

在 8 大权威基准模型通用能力的评估测试中,GLM-4.6 在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

在 Claude Code 进行了 74 个真实场景编程任务测试。结果显示,GLM-4.6实测超过 Claude Sonnet 4,超越其他国产模型。

官方放出的数据显示,在 token 消耗上表现也是同类模型的最低。

不过,跑分是一回事,实际效果还得测测,下面来看看我的一些测试 case 吧。

先来个简单的,我们让 GLM 4.6 自己介绍下自己吧。

前端 UI上和 Claude 4 基本没差异,不过这个能力,在 GLM 4.5 表现就还不错,但 4.6 给我的感受是,更快更稳了

比如让它做一个国庆旅游攻略 PPT,出来的速度更快,质量更高了。

下面让它做个 breakout 游戏,一次就能出来这个效果:

而这个是 Claude 4 出来的效果:

这个 case 明显能看出,GLM 4.6 效果好于 Claude 4 。

GLM 4.6 具备视觉理解能力,于是我直接丢了一张比较抽象的手绘原型图。

它很快就给我复刻出前端界面,效果很给力。

不过对于 Coding 能力的拷打,以上 case 都还勉强算是 demo 级别。

接下来,我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中,让它来做一些更复杂的,更偏向实际开发的一些任务。

PS:Claude Code 2.0 最大的更新是搞了个恢复机制,当 Claude Code 搞砸了,可以运行 /rewind 来撤消代码更改,大家可以更新下。

将将 GLM 4.6 放进 Claude Code 也很简单,一共就这么几步:

第一步,获取智谱 API key

第二步,配置环境变量

打开项目,输入以下配置:

ini 复制代码
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic

export ANTHROPIC_AUTH_TOKEN=YOUR_API_KEY

第三步,切换使用模型

手动修改配置文件 ~/.claude/settings.json

json 复制代码
{
"env": {
"ANTHROPIC_MODEL": "glm-4.6"
  }
}

这样 CC 的默认使用模型就改为了 GLM 4.6 了。多说一句,现在 GLM 4.6 的 API可以说是羊毛价了,最低一个月 20 就能痛快使用,我反手就冲了个 Pro。

我的第一个任务是让它做一个监控工具,输入一句话需求:

帮我做个小工具:监控'黑神话:悟空'在Steam上的最新评价,并把负面评价整理成markdown。你自己去网上搜一下怎么实现。

然后搭载了 GLM 4.6 的 CC 开始疯狂给我工作,它先是自动取搜索 Straem 评价的 API,然后去搜下如何实现了。

运行这个工具,真的就搜集到了最新的评价,并在我本地文件中做记录了。

整个过程很丝滑, GLM 4.6 帮我自动开发完成了这个工具。

要是以前,光是搜索这种方案,然后再编码就得花费不少时间。

最后一个 case,我是真没想到,我居然通过 GLM 4.6 重构了曾经风靡一时的 GitHub 开源项目 FlexSlider。

这是一款曾经非常非常流行的响应式轮播图/滑块插件。在那个前端框架还没普及的年代,几乎是做轮播图的首选。

它是一个纯粹的 jQuery 插件,代码里充满了典型的上古代码风格。

只是项目已经不维护了,不过很多老项目还在使用。

这个是这个开源项目原本实现的效果:

大家主要看下轮播图,下面,我在 Claude Code 中输入下面一段提示词将它重构为 Vue 的代码。

我现在需要重构下,我希望用Vue来重写,请你帮我重构

可以看到整个重构过程非常丝滑,它先是分析了整个项目,然后开始执行重构操作。

看下重构后的代码,是最新的 Vue3 代码。

然后看下最终轮播图效果,可以说和原先项目效果惊奇的保持了一致。

真的挺麻的,以前重构是一件非常复杂的事情,得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力,居然一次成功了。

好了,今天就到这了。

说实话,最后一个重构的 case 是真的震撼到我了。

重构屎山一样的祖传代码,一直是程序员的噩梦,繁琐、易错,还费时费力。

当 AI 已经能帮你重构祖传代码时,你就应该意识到,它已经从一个「玩具」进化成了一个可以并肩作战的「战友」了。

讲真的,从 GLM-4.6 身上,我看到了国产大模型不再是单纯地追赶和对标,而是真正开始在实用性上发力,切实地为我们开发者解决问题。

这波,我站智谱。

相关推荐
就不爱吃大米饭2 小时前
ChatGPT被降智怎么办?自查方法+恢复指南
网络·人工智能·chatgpt
RWKV元始智能3 小时前
RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力
人工智能·架构·开源
七牛云行业应用3 小时前
GPT-5 撼动量子计算:AI 在科研领域的颠覆性应用
人工智能·gpt·量子计算·gpt5
struggle20253 小时前
Lightpanda:专为 AI 和自动化设计的无头浏览器
运维·人工智能·自动化
数据猿3 小时前
AI时代下,我们需要新一代的金融基础软件
大数据·人工智能·金融
飞哥数智坊3 小时前
模力方舟 + Claude Code 实测:给登录页染上国庆红
人工智能·ai编程
gladiator+3 小时前
深度学习--行人重识别技术(超分辨率网络+ResNet101)附数据集
人工智能·深度学习
有Li3 小时前
EndoChat:面向内镜手术的基于事实依据的多模态大型语言模型|文献速递-文献分享
大数据·论文阅读·人工智能·算法·文献·医学生
金井PRATHAMA3 小时前
产生式规则对自然语言处理深层语义分析的影响与启示研究
人工智能·自然语言处理·知识图谱