"我怎么才用了几天,Cursor Pro 的 500 次请求额度就用完了?!"
如果你也发出过这样的灵魂拷问,这篇文章可以帮你省下不少冤枉请求次数。
我们将一步步讲清楚:
- Token 到底是啥?
- 目前主流 LLM 模型 API 的价格 & Token 成本对比(截至 2025年6月)
- Cursor 模型选择建议:不做冤种、用得其所
- 新增的 Max 模式是什么?为啥你可能一晚上亏了几十块?
国内开发者们快看!Cursor中文文档已经全面上线!现在,你可以通过母语更轻松地掌握这款强大的AI编码工具的全部功能,关于Cursor的开发技巧和博客都在这里。
更多精彩Cursor开发技巧博客地址:cursor.npmlib.com/blogs/curso...
更多Cursor使用技巧也可关注公众号 AI近距离
一、Token 是什么?
Token 是语言模型的"文字阅读单位", 就像我们说话是按"字"来计的,它们则是按"Token"。
OpenAI 和 Anthropic 的大模型不会按"字数"计费,而是按 Token。什么是 Token?一句话概括:
英文一个单词 = 一个 token 中文一个字 ≈ 1.5~2 个 token 代码一个换行、符号、缩进都是 token
内容类型 | 示例长度 | Token 估算 |
---|---|---|
英文段落 | 1000 字符 | ≈ 250 tokens |
中文文章 | 1000 汉字 | ≈ 1500-2000 tokens |
代码 | 500 行左右 | ≈ 2000 tokens |
也就是说,你用模型读一个网页、注释 500 行代码,它背后可能在吃下上万个 Token。 一个页面 5000 字的技术文档,大概是 3000~4000 个 token。
二、用 Token 是要花钱的:价格和计算示例
以下是不同模型的 Token 计算成本(单位:每 1K token):
模型 | 输入成本 | 输出成本 | 上下文上限 | 特点 |
---|---|---|---|---|
GPT-4o | $0.005 | $0.015 | 128K | 多模态全能选手 |
GPT-3.5 Turbo | $0.0005 | $0.0015 | 16K | 便宜,适合轻任务 |
Claude 3 Opus | $0.015 | $0.075 | 200K | 推理力最强,适合复杂任务 |
Claude 3 Sonnet | $0.003 | $0.015 | 200K | 推荐首选,均衡之王 |
Claude 3 Haiku | $0.0008 | $0.0025 | 200K | 速度最快,适合快速对话 |
Gemini 1.5 Flash | $0.00035 | $0.0015 | 1M | 上下文超长,响应极快 |
Gemini 1.5 Pro | $0.007 | $0.021 | 1M | 多模态+代码强,但价格高 |
DeepSeek-V2 | 免费 / 按调用 | - | 64K | 中文、代码均衡优秀 |
✅ Token 成本估算示例:
示例1:GPT-3.5 Turbo 问答
- 输入 100 token × 0.0000005 = 0.00005
- 输出 400 token × 0.0000015 = 0.0006
- 总成本:$0.00065
示例2:GPT-4o 写一篇 2000 字文章
- 输入提示词:130 token × 0.000005 = 0.00065
- 生成内容:1500 token × 0.000015 = 0.0225
- 总成本:$0.02315
示例3:Claude Haiku 分析代码
- 代码输入:2000 token × 0.0000008 = 0.0016
- 建议输出:400 token × 0.0000025 = 0.001
- 总成本:$0.0026
我们使用与模型提供商相同的分词器(例如 GPT 模型用 OpenAI 的分词器,Claude 模型用 Anthropic 的分词器),以确保 token 计数的准确性。你可以参考OpenAI 的分词器演示来查看示例。
三、Cursor Pro 的计费机制解读
对于普通 Pro 用户,每月有 500 次"快速请求额度",但这并不是按 token 数收费的,而是按请求次数收费。
内容 | 是否计入请求次数 |
---|---|
Chat 对话 / Explain / Fix / Refactor / Ask PDF 等 | ✅ 是 |
打开 MCP 脚本工具(如 Playwright 调试) | ✅ 是 |
使用内置 Agents(如 GPT / Claude 调代码) | ✅ 是 |
本地模型(如 ollama)或 Web API(自己接 GPT) | ❌ 否 |
一定注意:和 token 数无关! 一次请求 = 一次点击使用模型,不论处理的 token 多寡。
所以:
- 💸 一次轻量注释 = 一次复杂改写 = 一次读 50 页 PDF
- 用不对模型,就很亏!就很冤种!
四、Cursor Pro 的 Max 模式来了,非必要别碰!
Cursor 上线的 Max 模式:
每次请求 按实际 Token 收费,并 **在模型 API 官方价格基础上 +20%**计费包括你发送的消息、代码文件、文件夹、工具调用以及提供给模型的所有其他上下文所消耗的所有 token。
以下是 Max 模式下定价的一个示例:
角色 | 消息内容 | Token 数 | 备注 | 每条消息费用 |
---|---|---|---|---|
用户 | 为此更改创建一个方案(使用更昂贵的模型) | 135k | 无缓存输入 token | 2.7 次请求 |
Cursor | 我会分析需求并创建详细的实现方案...... | 82k | 1.23 次请求 | |
用户 | 用 TypeScript 实现更改并添加错误处理 | 135k | 大部分输入 token 已缓存 | 2.7 次请求 |
Cursor | 这是带有类型安全和错误处理的实现...... | 82k | 1.23 次请求 | |
总计 | 434k | 7.86 次请求 |
如果你一晚开 Max 模式 + GPT-4o,可能本月的500次请求就用完了。
🧨 建议:非必要不开 Max,开了也别用 Opus / GPT-4 级别模型!
五、不同任务如何选模型,最省又好用?
任务类型 | 推荐模型 | 理由 |
---|---|---|
写逻辑复杂代码 | GPT-4o / Claude Opus | 高质量值得投入 |
小 bug 修复 | Claude Haiku / Sonnet | 快,够用就好 |
翻译 / 注释 | GPT-3.5 / Sonnet | 不用动用贵模型 |
看网页 / PDF | Claude Sonnet | 上下文长,理解力强 |
快速问答 / 对话 | Claude Haiku | 响应飞快,极致体验 |
💡 Cursor Pro 用户可以在每次使用模型前,点击左下角下拉切换模型,别当冤种一直用最便宜的!或者乱开Max模式也是不对的!
六、结语:别做 500 次冤种会员
不要所有内容都是用cursor,比如我看有些同事甚至把它当作chatgpt提问用,一个小问题都使用它。在这里我推荐一个策略
"先免费模型试水,再用贵模型收尾"
- 用 DeepSeek 先问「你能帮我把这段需求转换为开发任务吗?」 免费的DeepSeek模型现在好多都支持,比如豆包,腾讯元宝等。
- 再用 Claude Haiku 补充细节或生成接口结构
- 最后在Cursor中用 GPT-4o 或 Claude Opus 精修实现逻辑(如果有必要)
一些小代码的细节优化或者review,也可以使用免费的一些网站完成。
原则:
-
- 不复杂的任务就别上 GPT-4o / Claude Opus
-
- 小事普通模型能解决的就别用 MCP Agent,
-
- 非必要不开 Max 模式,开了也要懂得切换性价比模型
这样你用掉的贵模型请求就最小化,500 次 Cursor Pro 请求和 API 费用都省下来!
更多内容请查看 Cursor中文文档
更多Cursor使用技巧也可关注公众号 AI近距离
你每次点一下按钮,可能都在烧一次会员额度。
🧠 模型是你的助手,不是吞金兽。好钢要用在刀刃上。