国产最强开源Coding模型发布了!!

这是苍何的第 439 篇原创!

大家好,我是苍何。

讲真的,最近的AI圈太卷了,卷得我都有点麻了。

你还别说,就这两天,DeepSeek 刚发布 V3.2,我屁股还没坐热,Claude 就甩出了王炸 Claude 4.5。

我以为这就完了,大家都能安心过个节了,结果智谱反手又发布了 GLM-4.6。

昨晚发了文章说 GLM 4.6 要来,但我是真没想到会来这么快。。。

好家伙,我群里直接就炸了,很多小伙伴都说这次提升很大,反响非常不错。

于是我也第一时间体验了下,不吹不黑,确实可以称得上是「国产最强开源Coding模型」。

我甚至用 GLM 4.6 重构了废弃的开源项目,效果很 nice。

不过在 show 我的实测 case 之前,有必要来看看一些官方发布的数据。

在 8 大权威基准模型通用能力的评估测试中,GLM-4.6 在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

在 Claude Code 进行了 74 个真实场景编程任务测试。结果显示,GLM-4.6实测超过 Claude Sonnet 4,超越其他国产模型。

官方放出的数据显示,在 token 消耗上表现也是同类模型的最低。

不过,跑分是一回事,实际效果还得测测,下面来看看我的一些测试 case 吧。

先来个简单的,我们让 GLM 4.6 自己介绍下自己吧。

前端 UI上和 Claude 4 基本没差异,不过这个能力,在 GLM 4.5 表现就还不错,但 4.6 给我的感受是,更快更稳了

比如让它做一个国庆旅游攻略 PPT,出来的速度更快,质量更高了。

下面让它做个 breakout 游戏,一次就能出来这个效果:

而这个是 Claude 4 出来的效果:

这个 case 明显能看出,GLM 4.6 效果好于 Claude 4 。

GLM 4.6 具备视觉理解能力,于是我直接丢了一张比较抽象的手绘原型图。

它很快就给我复刻出前端界面,效果很给力。

不过对于 Coding 能力的拷打,以上 case 都还勉强算是 demo 级别。

接下来,我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中,让它来做一些更复杂的,更偏向实际开发的一些任务。

PS:Claude Code 2.0 最大的更新是搞了个恢复机制,当 Claude Code 搞砸了,可以运行 /rewind 来撤消代码更改,大家可以更新下。

将将 GLM 4.6 放进 Claude Code 也很简单,一共就这么几步:

第一步,获取智谱 API key

第二步,配置环境变量

打开项目,输入以下配置:

ini 复制代码
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic

export ANTHROPIC_AUTH_TOKEN=YOUR_API_KEY

第三步,切换使用模型

手动修改配置文件 ~/.claude/settings.json

json 复制代码
{
"env": {
"ANTHROPIC_MODEL": "glm-4.6"
  }
}

这样 CC 的默认使用模型就改为了 GLM 4.6 了。多说一句,现在 GLM 4.6 的 API可以说是羊毛价了,最低一个月 20 就能痛快使用,我反手就冲了个 Pro。

我的第一个任务是让它做一个监控工具,输入一句话需求:

帮我做个小工具:监控'黑神话:悟空'在Steam上的最新评价,并把负面评价整理成markdown。你自己去网上搜一下怎么实现。

然后搭载了 GLM 4.6 的 CC 开始疯狂给我工作,它先是自动取搜索 Straem 评价的 API,然后去搜下如何实现了。

运行这个工具,真的就搜集到了最新的评价,并在我本地文件中做记录了。

整个过程很丝滑, GLM 4.6 帮我自动开发完成了这个工具。

要是以前,光是搜索这种方案,然后再编码就得花费不少时间。

最后一个 case,我是真没想到,我居然通过 GLM 4.6 重构了曾经风靡一时的 GitHub 开源项目 FlexSlider。

这是一款曾经非常非常流行的响应式轮播图/滑块插件。在那个前端框架还没普及的年代,几乎是做轮播图的首选。

它是一个纯粹的 jQuery 插件,代码里充满了典型的上古代码风格。

只是项目已经不维护了,不过很多老项目还在使用。

这个是这个开源项目原本实现的效果:

大家主要看下轮播图,下面,我在 Claude Code 中输入下面一段提示词将它重构为 Vue 的代码。

我现在需要重构下,我希望用Vue来重写,请你帮我重构

可以看到整个重构过程非常丝滑,它先是分析了整个项目,然后开始执行重构操作。

看下重构后的代码,是最新的 Vue3 代码。

然后看下最终轮播图效果,可以说和原先项目效果惊奇的保持了一致。

真的挺麻的,以前重构是一件非常复杂的事情,得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力,居然一次成功了。

好了,今天就到这了。

说实话,最后一个重构的 case 是真的震撼到我了。

重构屎山一样的祖传代码,一直是程序员的噩梦,繁琐、易错,还费时费力。

当 AI 已经能帮你重构祖传代码时,你就应该意识到,它已经从一个「玩具」进化成了一个可以并肩作战的「战友」了。

讲真的,从 GLM-4.6 身上,我看到了国产大模型不再是单纯地追赶和对标,而是真正开始在实用性上发力,切实地为我们开发者解决问题。

这波,我站智谱。

相关推荐
shuououo12 分钟前
YOLOv4 核心内容笔记
人工智能·计算机视觉·目标跟踪
DO_Community4 小时前
普通服务器都能跑:深入了解 Qwen3-Next-80B-A3B-Instruct
人工智能·开源·llm·大语言模型·qwen
WWZZ20254 小时前
快速上手大模型:机器学习3(多元线性回归及梯度、向量化、正规方程)
人工智能·算法·机器学习·机器人·slam·具身感知
deephub4 小时前
深入BERT内核:用数学解密掩码语言模型的工作原理
人工智能·深度学习·语言模型·bert·transformer
PKNLP4 小时前
BERT系列模型
人工智能·深度学习·bert
兰亭妙微5 小时前
ui设计公司审美积累 | 金融人工智能与用户体验 用户界面仪表盘设计
人工智能·金融·ux
AKAMAI5 小时前
安全风暴的绝地反击 :从告警地狱到智能防护
运维·人工智能·云计算
岁月宁静5 小时前
深度定制:在 Vue 3.5 应用中集成流式 AI 写作助手的实践
前端·vue.js·人工智能
galaxylove5 小时前
Gartner发布数据安全态势管理市场指南:将功能扩展到AI的特定数据安全保护是DSPM发展方向
大数据·人工智能
格林威6 小时前
偏振相机在半导体制造的领域的应用
人工智能·深度学习·数码相机·计算机视觉·视觉检测·制造