大家好,我是老刘
老刘做Flutter和客户端开发已经好多年了,AI时代到来后一个最显著的变化就是我们需要自费上班。
啥意思呢?就是你从事一份写代码的工作,但是你要自己买AI开发工具,比如Trae、Cursor、Claude Code等。
最近的几个月我主要的开发工具是Trae,原因很简单,Trae目前来说是最便宜的可以使用到顶级大模型的工具。

其实原先有Claude系列模型的时候更理想,但是即使没有我觉得Gemini-3.1-pro和Gpt-5.3-codex的效果也很不错。
Gpt-5.4也很好,但是排队太慢了。
那么最近Trae开始转向Token计费模式了。这种模式下Trae还是性价比最高的选择吗?
这篇文章我们来分析一下在深度对话开发的情况下,Trae的Token计费模式是否符合预期。
一、先说结论
- Token模式下,上下文是隐形杀手 :
- 多轮深度对话中,Input(历史上下文)的累积消耗远高于 Output(AI 回复)。
- 省钱要点:勤换 Session。一旦问题解决,立即新建对话,避免为无效历史付费。
- 模型选择决定钱包厚度 :
- Gemini 3.1 Pro 性价比极高,比 Claude 4.6 Sonnet(API方式) 便宜约 30%。
- 建议将 Gemini 设为默认模型,Claude 用于攻坚。
- 替代方案推荐 :
- Windsurf:对长上下文有优化。
- VS Code + Continue + 中转 API:终极省钱 + 顶级模型方案。
二、真实场景成本估算
以一次9轮深度的技术问答(含大量上下文)为例:
本次会话的数据统计
在9轮对话完成后我让Gemini给我做了一个估算统计,如下:
我们进行了大约 9 轮对话(您问 9 次,我答 9 次)。
- 输入(Input) Token:
- 累计上下文:每次您发新问题时,我都必须把之前所有的问答历史打包发给模型,模型才能知道前文说了啥。
- 第1轮:~500 tokens (初始提示词)
- 第2轮:~1,500 tokens
- ...
- 第9轮:~12,000 tokens (累积了之前所有的长篇大论)
- Total Input:这9轮累计发送给模型的Input约为45,000~50,000 Tokens。
- (老刘注:这是Token模式最坑的地方,越聊到后面,每一句话的成本越高,呈线性增长。)
- 输出(Output) Token:
- 我的每次回答都比较详尽(平均约 600-800 中文字符,约合 800-1000 Tokens)。
- Total Output:9轮x1000≈9,000 Tokens。
消耗量统计
- Total Input(历史累积): ~50,000 Tokens
- Total Output(AI回复): ~9,000 Tokens
成本对比表
| 模型 | 单价 (Input / 1M) | 单价 (Output / 1M) | 本轮对话总成本 ($) | 本轮对话总成本 (¥) | 备注 |
|---|---|---|---|---|---|
| Claude 4.6 Sonnet | $3.00 | $15.00 | $0.29 | ~¥2.0 | 逻辑最强,最贵 |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.21 | ~¥1.5 | 性价比首选 |
| DeepSeek V3 (API) | ~$0.10 | ~$0.20 | <$0.01 | <¥0.1 | 价格屠夫,几乎免费 |
注:模型价格是从国内代理商采集的,可能会有变化。
Trae的 <math xmlns="http://www.w3.org/1998/Math/MathML"> 10 月费(包含 10月费(包含 </math>10月费(包含20的token用量)约等于70-100次这样的深度长对话。
如果每天进行 >3 次此类对话,订阅费可能不够用。
大家可以大致估算一下自己这个用量是否能满足你一个月的日常使用需求。
如果和自己的需求量差距较大的话,可以考虑下面的替代方案。
三、替代方案
A. 主流 AI IDE 替代方案
| 工具 | 计费模式 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|---|
| Trae | Token 制 | Solo 模式 强大;国内直连速度快;体验丝滑 | $20 额度有限;重度使用需关注消耗 | 追求极致体验且网络受限的用户 |
| Cursor | Token/Credit | 老牌强者;Composer 功能强 | 也是 Token 计费;需 VPN | 习惯 Cursor 操作流的老用户 |
| Windsurf | 订阅制(超额按 API) | Cascade 引擎对上下文压缩好;更耐用 | 需 VPN;国内连接不稳定 | 追求高额度且有稳定梯子的用户 |
| Claude Code | 订阅 + API 混合 | 原生 Anthropic 生态;代码理解与重构能力强 | 国内网络门槛高;容易封号 | 复杂工程改造、重构和疑难问题攻坚 |
不同工具完成同样任务的token消耗是不一样的,所以无法简单的横向对比。建议大家还是都尝试一下。
这里还是比较推荐Windsurf,虽然月费20$,但是上下文压缩比较好,对于多轮对话的场景,可以有效减少token消耗。另外也有Claude系列模型可以选择。
B. 极客方案(按量付费):VS Code + Continue + 本地模型
这是目前性价比最高 且灵活性最强的方案。
核心逻辑在于模型分流(Model Routing) :Continue允许你为IDE的不同功能配置不同的模型,从而实现成本与智商的完美平衡。
1. 分流的逻辑
Continue 允许你把 IDE 的大脑拆解成 4 个独立工种,每个工种用最适合的模型:
| 工种(Role) | 职责 | 推荐模型 | 评价 |
|---|---|---|---|
| Chat(对话) | 解决复杂逻辑、架构设计 | 主力 :Gemini 3.1 Pro 攻坚:Claude 4.6 | 主力:推理能力和成本平衡 攻坚:代码能力最强 |
| Autocomplete(补全) | 按Tab键补全代码 | 默认 :本地部署 复杂场景:Qwen3-Coder | 极速且极便宜 |
| Edit(行内修改) | 选中代码Cmd+I修改 | 默认 :本地部署 复杂场景:Qwen3-Coder | 仅在关键修改时付费 |
| Embeddings(索引) | @Codebase全库搜索 |
Voyage-code-3 | 搜索更精准;需自备API Key(含免费额度) |
对比 Trae/Cursor:
- Trae:代码补全和行内修改的模型通常内置不可选,你无法享受指定模型极低成本优势。
- Continue:代码补全和行内修改都可以指向本地模型或者成本极低的国内模型。
Continue最大的价值在于可以将代码补全和行内修改等对模型能力要求没有那么高的场景指向本地模型,或者成本极低的国内模型。
以老刘自己的迷你主机为例,7840HS + 32G 内存(核显 780M),跑7b级别的Qwen3-Coder可以满足日常使用需求。
2. 方案优缺点
- 优点 :
- ✅ 极致省钱:补全等高频操作免费,日常问答可以使用费用低廉的国内模型。复杂问题再切换到国外顶级模型。
- ✅ 隐私安全 :支持 Ollama 本地模型,实现 $0 成本 + 100% 隐私。
- ✅ 透明可控:每一分钱都知道花在哪个 API 上。
- 缺点 :
- ❌ 配置门槛:需要自己申请 API Key 并配置 JSON。
- ❌ 体验差距:全自动 Agent 模式(如 Composer/Solo)可能会比Cursor的有一定差距。
3. 避坑Continue官网的Starter Plan
你在官网可能会看到**Starter Plan($3/million tokens)**的定价。
千万别买!千万别买!千万别买!(重要的事情说三遍)
这是Continue官方提供的懒人代理服务。他们帮你去调模型,然后收你$3/M的统一价。
去任何一个API代理商大概率都可以找到更低的价格。
总结
不同的IDE,即使用相同的模型完成一样的任务,其token消耗也大不相同。
所以不要简单的横向对比,把这些工具放到你的实际工作场景中验证一下,看哪个更符合你的需求。
最后,不管你选了哪种方案,一定要保证有顶级大模型兜底。(比如Claude 4.6,Gemini 3.1 Pro等)
不要简单的根据SWE-bench Verified这类测试的成绩来判断一个模型的能力。老刘的体验是Claude 4.6在实战中的总体表现是最好的,很多SWE-bench测试成绩很接近的模型在实战中表现会差很多。
🤝 如果看到这里的同学对客户端或者Flutter开发感兴趣,欢迎联系老刘,我们互相学习。
🎁 私信免费领老刘整理的《Flutter开发手册》,覆盖90%应用开发场景。可以作为Flutter学习的知识地图。
💬 : laoliu_dev
📂 老刘也把自己历史文章整理在GitHub仓库里,方便大家查阅。