国产CodingPlan“玩不起”,玩GPT5.5去了!

难受啊!

最近国产的 CodingPlan 全面收拢,要么转 TokenPlan 了,要么转配额少得要命,动不动就是 200 元一个月。

要知道 OpenAI 的 GPT5.5 + Codex,也才 20 美金,能力比你们强一个级别,价格也才 140 RMB 不到,配额还比你们多很多。

你们说怎么选?

我来给你们分析一下现状!

轰轰烈烈的国产模型"牛逼"之后,没两个月功夫,现在是个什么情况了呢?

腾讯和阿里基本不搞 CodingPlan 了,全转 TokenPlan,按量计费,毫无性价比。

关键是毫无诚信,说换就换!

目前还能用的 CodingPlan 主要是火山方舟、智谱、MiniMax、Kimi。

火山方舟的问题是能力一般,配额一般。

智谱是能力不错,配额也不错,但是一般人估计买不到,另外也是一直在收拢配额。

MiniMax 价格和配额都还算良心,但是能力太一般了,当时宣称自己是编程和智能体SOTA,我现在终于悟了,得倒过来看。

Kimi 现在能力还行,但是配额少的可怜。

昨天晚上我统一测试了我手里有的几个 CodingPlan,结果真的一言难尽啊!

各有各的毛病,没有一个顺手的。

我就就测试了两个问题:

一个是让它们帮我汇总一个现在最新的主流大模型 API 的价目表。

一个是写一篇 5 万字、10 个章节的修仙小说。

下面就来看看各位选手的表现吧。

1、Kimi

其实最近我对 Kimi 的印象还算不错的。至少它的"能力和宣传比"要比其它模型好很多。

但是它也有它的问题。目前最大的问题是配额很少,能力不稳定。

下面来看一下具体的例子的情况。

首先看价目表的情况。

价格对不对我先不说,看到这个模型型号我就已经不相信它了。

现在是 2026 年 4 月 24 号,OpenAI 已经发布 GPT5.5 了,Anthropic 已经更新到 Opus4.7 了。

它的结果还停留在 GPT-4.5、Opus4。

这个还不是最离谱的,国内模型阿里云是 Qwen3-235B-A22B,还有什么 360 智脑、华为盘古大模型 Pangu-Σ、天工 3.0、GLM-4-Air。

国外的你查不到也就算了,国内的也不知道?

我是开放了网络权限的呀!

然后看看修仙小说的情况:

这个目录和大纲是能看的啊,好像有点那个味儿,字数也是符合要求的,大概写了 5 万多字。

问题在于它还没有保存文件,配额就消耗完了。

这是我手动从对话窗口里复制出来,保存到文件里面的。

5 万字大概消耗了 63% 的配额!

之前的表格整理花了 37% 的配额!

这些我都没有任何修改需求啊,是直接跑一轮就消耗完的。

如果我对第一个表格不满意,我提出一次修改意见的话,可能整个配额就没了,没有第二项测试了。

活干得不漂亮,配额消耗得很快!

2、火山

看完 Kimi 再来看一下火山。

下面是火山豆包的价目表:

这个表格几乎和 Kimi 一个模子出来的。它认为目前 OpenAI 最新的模型是 GPT-4.5,主流模型是 GPT-4o。

Anthropic 的模型才更新到 Sonnet 3.7!

国产模型方面,也基本上是一个问题,太老了。

明明给了它们网络权限,它们为什么就找不到最新的数据呢?还是完全没有想过去找?单纯拼记忆?

火山比较好的一点是,做了头部筛选,可以筛选厂商、地区和搜索。

然后看一下小说部分:

其实小说看标题都是还可以的,AI 最擅长的就是这种格式化的标题了,一字不差。

小说,主要还是看内容了。

我就不看了,我只是用它来测试 Token 消耗的。

火山的消耗比 Kimi 好很多,两个任务完成大概是消耗了 15%。

火山豆包很长时间内首次连接延迟特别高,但是它完成一个整体项目的时间还是比较短的,也就是算是比较快的。

只是它的水平也就是勉强能用、适合大众使用,作为 CodingPlan 显然是不太够用的。

3、MiniMax

然后我们再来看看最强智能体和编程模型 M2.7。

先看第一个例子:

所有人都交卷了,它还一直卡着,看了一下测试目录。什么都没有生成!

我仔细查看了日志文件:

发现开始没多久它就因为 API 错误停了工作!

最后停留在查询 DeepSeek 价格这一个环节,然后就再也没有请求了。

我看了一下我账号的后台消耗情况,只调用了三次 API!!!

然后来看看写小说的情况:

它写的小说叫《天命道途》,它是用 TXT 存储了不同的章节。

它有一个非常明显的问题是,第一章的字数就不对。

我要求是 5000 字一个章节,它写了 3990,误差 20%。

两个任务跑下来,配额没消耗多少,它应该还是按次消耗,比较良心。

但是结果基本上不能用的状态。它本身模型就小,整个智商确实"很感人"的。

4、智谱 GLM

智谱在国内算是做得比较好的了,但是它也有它的问题。

先看价目表:

终于看到一个正常的了。

楼上各位看看人家的表现。

GLM5.1 正确获取到了最新的模型名称。

GPT5.4 和 Claude Opus 4.7 确实是最新的模型了,昨天晚上 GPT5.5 还没出来!

国内的数据也还可以,至少自家的模型基本都在了!

这一点上,GLM 就稳多了。

再来看看小说部分:

它的小说名字叫《逆天仙途》,怎么看着有点眼熟呢?... 这个不重要!

重要的是,你们知道它为什么只有 3 个章节么?

因为它写了三章之后就卡住了,我也不知道它要写到什么时候。我实在受不了,就停了。

把模型换成 4.7 才顺畅地把小说写完,但是字数也不准。

说好的一章 5000 字,只写 1262 个字,加上标点符号也才 1415 个字。误差 70%!

配额方面整体还好。

因为我是老套餐的 Pro 用户,配额基本上没有动过,就是 1%。

我看了下 Token 消耗了大概 100 万多,所以 Pro 这个套餐量还是不少的。

问题是慢啊,5.1 完全不是正常的速度,是很慢啊,4.7 又弱!

本来是兴致勃勃地想测一下它们的套餐 Tokens 情况,但是出现了各种问题,所以搞得很无语。

刷基准的时候,个个都很牛逼,真干点活就各种问题。

要么结果差的不行,要么配额一下就没了,要么慢的要死,要么所有毛病都有。

你们说,我图啥呢!

要快、要强、要能干有 Opus4.7;

要快、要强、要能干、要配额有 GPT5.4。

这两个也才 20 美金一个月啊,转换成人民币 140 不到。

现在国内的套餐 Pro 档基本上就是 200 这个价位了。

现在 GPT5.5 也来了,能力只会比国产强,绝对不会比国产弱。

它还有自己的编程工具 Codex 终端版和桌面版。

它的桌面版已经做得很好了,现在包含了编程和日常两种模式。

管理项目能力很强,操作电脑的能力也很强,有专门的 Computer Use 能力,直接操作本地软件、操作浏览器。

关键人家配额也给力啊。

我死命用也用不完,还动不动就重置。

你们看周配额才消耗了 10%啊,5 小时配额基本都是满血状态,一般也就用到 10%~20%。

最后不禁要问一句,我拿真金白银支持国产,国产拿什么来回报我的?

用不停的修改套餐,缩减配额,低智的模型来回报我么?


刚刚看到群里消息,DeepSeek V4 真的出了,我赶紧去看看,能否打破这种局面!

相关推荐
数智化精益手记局1 小时前
4m变更管理实战:拆解4m变更管理四大要素的管控功能与常见难题
大数据·数据结构·数据库·人工智能·精益工程
2501_945837431 小时前
OpenClaw:从 “聊天” 到 “执行”,AI 智能体的破局者
人工智能
DO_Community1 小时前
无封号焦虑!Claude Code 官方插件 +VS Code ,稳定接入的配置指南
人工智能·vscode·aigc·claude
woai33641 小时前
AI通识-人工智能的发展&产生要素
人工智能·ai
互联网推荐官1 小时前
APP开发的架构决策:PaaS平台与自建体系的工程边界在哪里
人工智能
xiami_world1 小时前
产品路线图的技术实现升级:从甘特图到AI Agent驱动的无限画布闭环
人工智能·ai·信息可视化·流程图·产品经理·甘特图
思绪无限1 小时前
YOLOv5至YOLOv12升级:疲劳驾驶检测系统的设计与实现(完整代码+界面+数据集项目)
人工智能·深度学习·yolo·目标检测·计算机视觉
唯创知音1 小时前
语音提示器雷达感应方案从红外到雷达的技术升级与模组选型指南
人工智能·语音识别·语音提示器·提示器·雷达选型指南