用完火山,腾讯,阿里的编程模型,我失眠了!

昨天我失眠了,今天火气有点大!

那么大的厂,怎么做了这么一tuo。

拿出来的时候精美的,一锤就碎了!

本来这篇文章的标题应该是《全TM辣鸡,浪费生命》!

但是我想想还是算了,我成长了。

我对不起 GLM5,如果它是"若至",它们就是"滞涨"了。

好吧好吧,这些厂也没有在我面前吹过牛逼,只是浪费了我一天一夜的时间而已。

😐我就原谅他们了!

我就开头骂一句,后面我就好好写了,让大家知道一下这三家在编程领域的真实水平。

今天不看基准,基准毫无意义!

我的测试场景,请直接参考《Claude Opus4.6 实战记录,欢迎对标和超越!》这一篇。

文章有一点点长,大概 10000个字符!

我会先从测试环境说起,然后看一下测试结果,分享一下过程,分析一下bug,对比一下速度和tokens消耗情况。

1、测试环境

先简单说一下测试环境和测试对象。

我的测试工具为 Claude Code,通过 CCSwitch 切换!

使用的模型分别是:

  • 阿里百炼的qwen3.5-plus
  • 火山方舟的Doubao-Seed-2.0-Code
  • 腾讯混元的tc-code-latest

选择原则,就是他们自家的最新模型,或者最新的编程模型。

测试基于同样的一个 Base 项目,然后用同样的工具,同样的提示词:

不同文件夹下面是不同的模型升级后的项目。

2、直接上菜

所有测试我已经跑完了。

我们先来看结果,用同样的命令启动:

这是 Base 项目。

没改之前,角色管理是这样的:

然后我们来看看,修改完成之后是什么样的。

我们的评判标准还是一样的:首先看能不能用,然后看好不好用,最后看全不全面。

能不能用?

下面,我们就打开网页,进行验证了。

阿里:

能正常启动,角色管理布局有点崩,也没有看到头像区域。

当点击编辑或者添加角色:

💥直接崩了, 我们先不管错误是什么,反正就是错了。

核心功能的第一步,就不可用。

火山:

启动正常,布局正常,可以看到一个头像区域,目前用一个机器人图标填充。

当点击编辑或者添加角色:

💥也直接崩了,而且错误一模一样。

如果我不是用端口号来区分,我都以为启动了同一个服务。

很显然,这个是没法用的。

腾讯:

启动正常,显示基本正常。头像部分用了一个小人占位。

点击添加或者编辑:

卧槽卧槽卧槽,居然有一个正常的!!! 我现在标准很低,能正常点开这个页面就很开心了。

补充一张截图:

腾讯的模型居然还考虑到了这一点,也算是惊喜了。

但是,它这个系统还是不太能用。

角色编辑和角色添加里无法拉取角色列表和模型,导致角色是一个空壳。这样群聊就完全搞不起来。

好不好用

没法用,谈不上好用。

全不全面

没法用,谈不上全不全面。

3、制作过程

下面我是最初的提示词,我测了很多模型,都是用这一段开始的。

提示词:

markdown 复制代码
目前群聊接力的时候可以选择平台管理中的模型,也可以对这些模型预先配置系统提示词和角色提示词,这样已经可以通过系统提示词来个性化聊天了。但是通过平台配置里面绑定角色比较有局限性------这样一个平台就只能是一个角色。
​
我希望换另外一种设置:**角色里面选模型**,然后群聊开始的时候,我可以直接选平台,也可以直接选角色。角色的管理还是在系统设置的"角色管理"中进行。
​
为了实现上面的需求,角色功能需要升级:
​
- 除了可以设置提示词之外,还得能**选择平台和模型**
- 另外还能**设置头像**
- 如果设置了头像,群聊的时候就显示自定义头像;如果没有设置头像,就用对应模型平台的 logo 作为头像
​
​
​
我的需求大概是这样。说说你的这个需求的理解,不急着写代码

然后来看看它们的回复。

第一轮:看起来都是高手!

如果单纯看这一轮的回答,看起来各个都是高手,说的头头是道。

阿里:

yaml 复制代码
● 我来梳理一下你的需求,确保理解正确:
​
  当前架构
​
  平台 (Platform)
    └── 绑定模型 (Models)
        └── 可配置系统提示词/角色提示词
            └── 群聊时:选平台 → 用该平台的固定角色
​
  问题:一个平台只能对应一个角色,不够灵活。
​
---
​
  新架构
​
  角色 (Character)  ← 核心实体
    ├── 提示词 (Prompt)
    ├── 头像 (Avatar) [可选]
    └── 绑定的模型 (Selected Model from a Platform)
        └── 模型来自某个平台
​
  群聊启动时:
    ├── 方式 A:直接选平台(保持原有逻辑)
    └── 方式 B:选角色(角色自带模型)
​
---
​
  需要改动的地方
​
    1. 角色管理(系统设置 → 角色管理)
​
  - 新增字段:
    - platform_id / model_id:选择模型
    - avatar_url:自定义头像
  - UI 上需要添加模型选择器和头像上传/输入框
​
    2. 群聊启动界面
​
  - 选择方式二选一:
    - 选平台(现有逻辑)
    - 选角色(新逻辑,选中后自动使用该角色绑定的模型)
​
    3. 群聊头像显示逻辑
​
  if (角色有 avatar) {
    显示角色自定义头像
  } else {
    显示模型所属平台的 logo
  }
​
---
​
  我的理解
​
  简单来说,就是把"角色"从平台的附属配置中独立出来,让角色成为一级实体:
​
  - 角色可以跨平台绑定任意模型
  - 同一个平台的不同模型可以对应不同角色
  - 群聊时可以直接选人(角色),而不是先选平台再接受固定角色
​
  这样理解对吗?有没有遗漏或偏差的地方?

这里理解是没太大问题的。

接下来它还查看了代码结构,然后提出了改动方案,并询问了我很多问题。

markdown 复制代码
关键设计问题
​
  在开始实现之前,有几个设计点需要确认:
​
    1. 角色与平台的关系:
​
    - 一个角色绑定一个模型(来自某个平台)?
    - 还是绑定一个平台(使用该平台的 selectedModel)?
​
    2. 群聊创建流程:
​
    - 如果用户选择"角色",是单选还是多选?
    - 如果多选角色,每个角色各自带模型,那底层平台怎么处理?
​
    3. 兼容性问题:
​
    - 现有的群聊会话(基于平台)需要继续可用
    - 现有的角色(没有平台/模型字段)需要兼容
​
  请确认一下:你期望的群聊启动流程是怎样的?
​
  - 方案 A:选平台(多选)→ 用平台绑定的角色
  - 方案 B:选角色(多选)→ 每个角色带一个模型
  - 方案 C:两者并存,用户可切换
​
​
好的,方案 C:用户可以选择"选平台"或"选角色"两种方式。
​
  让我再确认一些细节:
​
  需要确认的细节
​
    1. 角色与模型的关系
​
  - 一个角色绑定 一个模型(即绑定一个平台 + 该平台的某个模型)?
  - 例如:"资深程序员" 角色可以绑定 "阿里云百炼 → qwen3.5-plus"
​
    2. 群聊创建界面
​
  期望的交互是:
  [ 选择平台 (多选) ]  ------ 或者 ------  [ 选择角色 (多选) ]
         ↓                              ↓
     用平台的 selectedModel          用角色绑定的模型
​
  - 如果选角色(多选),比如选了 3 个角色,每个角色各自用自己的模型,对吗?
  - 这样底层其实还是对应多个平台(可能重复)
​
    3. 会话保存
​
  - 选平台创建的会话 → session.platformIds[]
  - 选角色创建的会话 → 需要新增 session.roleIds[]?还是直接转换为 platformIds?
​
    4. 头像显示
​
  - 如果角色设置了 avatar → 显示角色头像
  - 如果没设置 → 显示该角色绑定模型的平台 logo

这个前期细节真的拉满了,先不说问题是否精准,至少它在努力地提问,确认细节。

说实话,看到这里,我感觉它能把这件事情能干成。

接下来就是根据自己的方案开始干活了:

swift 复制代码
 ◻ 更新角色管理 UI,添加平台选择、模型选择和头像设置
     ◻ 更新 Role 类型定义,添加 avatar、platformId、modelId 字段
     ◻ 更新聊天 API 支持角色模式
     ◻ 更新群聊创建 UI,支持选择平台和选择角色两种模式
     ◻ 更新消息组件支持角色头像显示
​

火山:

markdown 复制代码
好的,我来梳理一下对这个需求的理解:
​
  核心变化:从"平台绑定角色" → "角色绑定平台+模型"
​
  之前的架构:
​
  - 平台(Platform)是主体,在平台配置里绑定角色
  - 局限性:一个平台只能对应一个角色
​
  新的架构:
​
  - 角色(Role)是主体,在角色配置里选择平台和模型
  - 一个平台/模型可以被多个角色复用
  - 群聊时可以选择:
    - 直接选平台(用平台的默认配置)
    - 直接选角色(用角色绑定的平台+模型+提示词+头像)
​
  角色功能升级点
​
    1. 角色配置增加字段:
​
    - 绑定的平台(Platform)
    - 绑定的模型(Model)
    - 自定义头像(Avatar)
​
    2. 头像显示逻辑:
​
    - 角色有自定义头像 → 显示角色头像
    - 角色无头像 →  fallback 到平台的 logo
​
  我的理解对吗?
​
  有几个问题想确认一下:
    1. 群聊时选择"平台"的场景还保留吗?还是只选择角色?
    2. 之前"平台管理"里的系统提示词配置,是保留还是移到角色里?
    3. 单聊(single-chat)功能是否也需要同步调整?
​
​

这个理解也没毛病,向我提了三个问题,问题不是太精准,但是至少提了三个问题。

我回答了他的问题,接下来他就开始干活了:

csharp 复制代码
更新 Role 类型定义... (58s · ↑ 337 tokens · thinking with high effort)
  ⎿  ◼ 更新 Role 类型定义
     ◻ 更新 roles store
     ◻ 更新角色管理页面
     ◻ 更新群聊创建页面
     ◻ 更新聊天消息显示

腾讯:

yaml 复制代码
我来理解一下你的需求,看看说得对不对:
​
  当前状态
​
  平台配置:
​
  - 平台 → 模型 → 系统提示词/角色提示词
  - 一个平台只能绑定一个角色
​
  群聊接力时:
​
  - 选择平台 → 使用该平台配置的模型和提示词
​
---
​
  你期望的新状态
​
  角色变成独立配置单元:
​
  - 提示词(已有)
  - 平台 + 模型(新增)
  - 头像(新增)
​
  群聊接力时:
​
  - 可以选平台 → 用平台配置的模型
  - 也可以选角色 → 用角色配置的模型 + 提示词 + 头像
​
  头像逻辑:
​
  - 有自定义头像 → 显示自定义头像
  - 没有自定义头像 → 用对应模型平台的 logo
​
---
​
  几个确认问题
​
    1. 角色管理的位置:目前系统设置里已经有"角色管理"功能吗?还是需要新增?
    2. 平台的角色配置:原来的"平台绑定角色"还要保留吗?还是完全改成"角色里选平台"这种模式?
    3. 模型选择:角色里选的模型,跟平台管理里的模型是什么关系?是直接引用平台管理里的模型,还是角色可以独
       立配置模型参数?
    4. 多平台模型:如果一个角色支持多个模型(比如同时支持 GPT-4 和 Claude),还是只能选一个?
​
  你希望先讨论哪部分,还是我直接去看一下现有代码再讨论?
​
​

这个理解也没毛病。而且同样也提出了问题。

它提出了4个问题。

第一个问题,就非常犀利,这也是最后他能成功去掉这个冗余的关键。

后面几个问题,只能说问到点了,但是从提问方式来看,对这个业务理解不够深入。

我回答了它的问题之后,它又问了我另外三个问题:

markdown 复制代码
几个确认问题
​
1. 群聊会话的参与者选择:你希望用什么样的 UI?比如:
​
- 一个列表同时显示平台和角色,用户多选?
- 还是分成两个 Tab,"选择平台" 和 "选择角色"?
​
2. 头像上传:自定义头像怎么处理?
​
- 用户输入 URL?
- 还是支持本地上传图片?
​
3. 角色选模型:角色选模型时,模型的列表从哪里来?
​
- 从选中平台的 models 字段读取?
- 还是角色可以自由填写模型名?
​
你觉得这个改造方向对吗?

这几个问题就实际了很多。而且它还提到了模型从哪里来,我说了从平台里来。

可惜,最后开发完成,它没有把平台列表显示出来,也就选不了模型了。

下面是它的开发计划:

scss 复制代码
​
​
 升级角色管理 API... (1m 35s · ↑ 1.8k tokens · thinking)
  ⎿  ✔ 升级 Role 类型定义
     ◼ 升级角色管理 API
     ◻ 改造角色管理页面
     ◻ 改造群聊创建页面
     ◻ 更新聊天消息显示

三个模型的理解都看完了,单纯看理解部分都问题不大,可能是我已经说得很清楚了。

差别主要在于阅读系统原有代码之后,给出的理解和提问,这部分就不是太精准和全面。

第二轮,都没有做详细方案

我上面列出来的都是理解和提问部分。

实际上有一个重要的环节,我没有贴出来,就是完整的开发计划

这部分非常关键,细节决定成败。

开始写代码之前,一定要完整理解这个项目,并且制定详细的计划。

它们做的都不是很好,计划非常短,大概就是一屏到两屏之间。

大概只有 Opus4.6 五分之一不到

Opus4.6做了10个章节:

细节非常丰富,所以最后一次过,没有任何运行错误和逻辑bug。

第三轮,结果全拉了!

胜负不在战时,而在战前。

从上面的设计方案基本就知道结果了。

虽然第一轮都像模像样,但是第二轮已经漏出底裤,第三轮,就是全部裸奔了。

下面我们来深入分析一下,它们到底写了个啥。

我会让Opus来做分享,重点分享它们的需求完成度,代码质量问题,以及为什么点击创建功能出错。

先看阿里百炼

需求完成度:

存在的问题:

创建出错原因:

创建角色(POST)时 API 路由忽略了新增字段,是最核心的 bug !

再看一下火山的情况。

需求完成度:

存在的问题:

创建出错原因:

但由于创建时就没有保存新增字段,编辑时加载的表单数据就是空的,形成恶性循环。

最后看一下腾讯的情况。

需求完成度:

存在的问题:

从上面 review 看,基本上都存在一个或者多个严重的 bug。

看来,它们写的不是代码,是 bug。

我以后不比谁厉害了,比谁的bug多。

谁干好,这个问题已经没什么好比了,半斤八两。

下面来看看一些能比的,比比使用时间和 tokens 消耗情况

4、时间对比

在测试的同时,我也大概记录一下时间。

阿里:

阿里开发完成,到开始安装依赖包的时候,大概是消耗了26分钟左右。 我测试的时间大概是在下午5点左右。

火山:

火山开发完成,到开始安装依赖包的时候,大概是消耗了 14 分钟左右。我的测试时间大概是在晚上 11 点多。

腾讯:

腾讯这个构建完成,到可以测试的时间是 30 分钟。测试时间是在晚上零点多。

测到腾讯已经半夜了,直接导致我失眠了。

从我的测试来看,火山明显要快很多,腾讯和阿里比较慢。

我记得最早测试方舟这个套餐的时候写一个博客都要很久,现在速度好像提上来了。

腾讯和阿里可能还在提产能,速度不太行。

当然,也可能受时间段和高峰期的影响,仅供参考。

5、消耗对比

除了记录时间,我也留意了消耗情况。

具体数据如下。

阿里:

消耗了 9%,它这个用量是按调用次数算的。

火山:

消耗了 33%,好像不是按次数算的。

后期消耗增长巨快,估计是上下文大了,tokens 消耗很快。但是相对而言它的开发速度也很快。

腾讯:

用了 6.8%,看起来它的统计方式和阿里一致,是按次数计算的。

从用量来说,火山消耗比较快,我估计用不了多久 5 小时配额就用完了。阿里和腾讯因为按次数算的所以比较耐用,即便是入门款基本也用不完。

最后简单说几句!

为了测试它们的实力,我干到了半夜,后来躺在床上一直睡不着。

我陷入了沉思:我为什么要浪费这时间!

看它们写代码,真的一个头两个大

我一个月花40或200。

是找它们写代码的,不是写 bug 的呀。

是找它们来干活的,不是给它们擦屁股的呀。

是找它们来节省时间,不是浪费时间的啊。

最后,我反思。

它们考不好,可能是我这题太难了,怪我!

它们写代码不好,可能是打开方式不对,肯定是的。

兄弟们,我自罚一杯。

接下来,我不找茬了,主打吹牛逼~。~

Base的代码已经发出来了:

github.com/JarvisPMS/c...

有兴趣的可以git下来玩一玩!

相关推荐
KevinZhang135793 小时前
第 8 节:集成 CubeJS 数据模型
ai编程·vibecoding
一块小方糖3 小时前
OA工时填报Skill,打通gitlab与禅道,实现每日工时自动提交
ai编程
QX_hao3 小时前
Codex_AGENTS_设置教学文档
ai编程
YimWu3 小时前
面试官:能聊聊 oh-my-opencode 这个插件都有啥内容吗?
前端·agent·ai编程
小小小小小鹿3 小时前
Claude Code Agent Skills 入门指南(下):理解Skill的工作机制
llm·ai编程·claude
crossoverJie3 小时前
DeepWiki 优化实战:代码行号与确定性目录生成
后端·ai编程
小虎AI生活5 小时前
全网爆火的 OpenClaw 迎来最强对手?腾讯“龙虾战略”的杀招在这
ai编程
智算菩萨6 小时前
ChatGPT 5.4 API深度解析:从Transformer架构到企业级应用实践
人工智能·深度学习·ai·chatgpt·ai编程
星辰引路-Lefan6 小时前
全平台 Docker 部署 CPA(CLIProxyAPI Plus) 灵活定制指南 (Linux/Windows)——接入Codex
linux·windows·docker·ai·ai编程