Cline 接入 Kimi K2 完整配置教程：apiBase 斜杠坑 + maxTokens 截断问题，填了四遍才跑通

上周三我把 Cline 的后端从 Claude Sonnet 换成 Kimi K2，想省点 token 费。结果 custom provider 那几个字段我反复填了四遍------第一遍 404，第二遍能跑但输出莫名其妙断在半截，第三遍改了 maxTokens 还是截断，第四遍才发现是 apiBase 末尾多了个斜杠和 maxTokens 上限配置的双重问题。折腾了大半天，把坑全踩完了，写下来省得你们再来一遍。

Cline 接入 Kimi K2 的核心配置 ：选 OpenAI Compatible 模式，Base URL 填 https://api.moonshot.cn/v1（末尾不加斜杠），Model ID 填 kimi-k2-0711-preview，Context Window 手动填 131072，Max Output Tokens 设 8192。两个隐藏坑：apiBase 末尾加了 / 会拼出双斜杠路径导致 404；maxTokens 如果填超过 8192，Kimi K2 不会报错而是静默截断输出。

说明：本文配置数值（Context Window 131072、Max Output Tokens 8192）基于笔者实测，建议以 Moonshot 官方文档为准，如有出入以官方为准。

这篇适合谁

已经在用 Cline 写代码，想把后端模型换成 Kimi K2 省钱的
配了 OpenAI Compatible 但一直报 404 或输出被截断、找不到原因的
从 Claude Code / Cursor 迁移过来，想用 Cline + 低价模型搭个日常编码环境的
不想看 Moonshot 官方文档那堆 Python 示例，只想知道 Cline 里怎么填的

整体流程

在 platform.moonshot.cn 创建 API Key
Cline 侧边栏 → Settings → 选 OpenAI Compatible
填 Base URL、API Key、Model ID
手动设置 Context Window 和 Max Output Tokens
发一条消息验证连通性
（可选）用 curl 独立排查网络问题

graph LR A[Moonshot 控制台 拿 API Key] --> B[Cline Settings 选 OpenAI Compatible] B --> C[填 Base URL 不带末尾斜杠] C --> D[填 Model ID kimi-k2-0711-preview] D --> E[设 Context Window 131072] E --> F[设 Max Output 8192] F --> G[发消息验证]

先说结论

字段	正确值	常见错误	后果
Base URL	`https://api.moonshot.cn/v1`	末尾加了 `/`	请求路径变成 `/v1//chat/completions`，404
Model ID	`kimi-k2-0711-preview`	填 `kimi-k2` 或 `k2`	404 model not found
Context Window	131072（128K，见官方文档确认）	不填或填默认 4096	Cline 自动截断上下文，丢失前文
Max Output Tokens	8192（见官方文档确认）	填 16384 或更大	静默截断，输出到限制位置就断，不报错

第一步：拿 API Key

去 platform.moonshot.cn 注册登录，左侧「API Key 管理」点创建。Key 前缀是 sk-，复制保存好。

这步没什么坑，唯一注意：别把 Key 粘贴到 Cline 时多复制了前后空格，否则会报：

复制代码

Error: 401 Unauthorized - Invalid API key
{"error":{"type":"invalid_request_error","message":"Invalid API key"}}

第二步：Cline 选 Provider

VS Code 侧边栏点 Cline 图标 → 右上角齿轮（Settings）→ API Provider 下拉选 OpenAI Compatible。

不要选 OpenAI，也不要选其他具名 Provider。Kimi K2 走的是 OpenAI 兼容协议，但 endpoint 地址不同，必须用 Custom。

第三步：填 Base URL（第一个大坑）

填入：

复制代码

https://api.moonshot.cn/v1

末尾不要加斜杠。 这是我踩的第一个坑。根据测试，Cline 拼接请求路径的逻辑是 ${apiBase}/chat/completions，如果你的 Base URL 是 https://api.moonshot.cn/v1/，实际发出的请求就变成了：

复制代码

POST https://api.moonshot.cn/v1//chat/completions

双斜杠。Moonshot 的网关对这个路径返回 404，但错误信息长这样：

复制代码

Error: 404 Not Found - model not found
{"error":{"type":"invalid_request_error","message":"The model `kimi-k2-0711-preview` does not exist"}}

它说 model not found，但实际上是路径错了，根本没到模型路由那一层。我第一遍就被这个误导了，以为是 Model ID 写错，反复改名字改了半小时。其实把末尾 / 删掉就好了。

这个报错信息挺坑的，希望 Moonshot 那边能优化一下网关的 404 响应。

第四步：填 Model ID

复制代码

kimi-k2-0711-preview

必须是完整名称。不能简写成 kimi-k2、k2、kimi-k2.6 或任何变体。Moonshot 的模型列表不支持模糊匹配。

我看掘金有人说填 kimi-k2 就行------不行，直接 404。

第五步：设 Context Window 和 Max Output Tokens（第二个大坑）

Context Window 填 131072（128K）。

Max Output Tokens 填 8192。

注意：以上数值来自笔者实测，请以 Moonshot 官方文档公布的参数为准。若官方已支持更大的输出窗口，按官方值填写即可，无需人为限制到 8192。

这里是第二个大坑，也是最阴间的一个：根据我的测试，Kimi K2 单次最大输出在 8K tokens 附近，但如果你在 Cline 里把 Max Output 设成 16384 甚至更大，它不会报错。 它会正常开始生成，生成到限制位置直接停，Cline 显示"Done"，你看到的输出就是被截断的半成品。

没有任何 warning，没有 finish_reason: length 的提示弹窗（Cline 的 UI 不会主动展示 finish_reason），代码写到一半就没了。我第二遍和第三遍就死在这------让它重构一个 200 行的文件，每次写到 120 行左右就断了，我还以为是网络不稳定，重试了好几次。

后来我用 curl 单独打了一个请求，看返回的 JSON 里 finish_reason 确实是 "length"，才意识到是输出上限的问题。

bash 复制代码

# 将 sk-your-key 替换为你的实际 API Key
curl https://api.moonshot.cn/v1/chat/completions \
 -H "Authorization: Bearer sk-your-key" \
 -H "Content-Type: application/json" \
 -d '{"model":"kimi-k2-0711-preview","messages":[{"role":"user","content":"hi"}],"max_tokens":8192}'

所以：Max Output Tokens 建议设 8192（或参照官方文档的上限值），不要随意填更大的数字。 如果你的任务需要更长输出，就得在 prompt 里拆步骤让它分段生成。

第六步：验证

在 Cline 对话框随便发一句"你好，回复 OK"，如果 3 秒内收到回复就算通了。

如果超时，先用上面的 curl 排查是不是网络层面的问题。api.moonshot.cn 可以直连，不需要代理，但个别企业内网可能有拦截。

不同场景怎么选

日常写业务代码（CRUD / 前端组件 / 脚本） ：Kimi K2 够用，价格相比主流高端模型有明显优势（具体定价请查阅 Moonshot 官方定价页，价格随时可能调整）。一天写代码算下来费用通常较低。

复杂重构 / 架构设计 / 多文件联动：Kimi K2 的输出上限会成为瓶颈。这种场景还是得用输出窗口更大、逻辑连贯性更好的高端模型。如果不想直接走官方 API 的高价格，可以通过 OpenRouter 这类聚合平台接入，改个 base_url 就能在 Cline 里切模型，不用每个厂商单独注册。

团队协作 / 需要审计日志：多人共用一个 Key 池的话，单独管每个人的用量比较麻烦。这种场景建议用带管理后台的方案。

预算极度有限 / 学生党：Kimi K2 目前性价比较高，跑 Cline 够用。但定价策略随时可能变动，建议定期关注官方定价页重新评估。

踩坑记录 / 常见问题 FAQ

Q: Cline 里选哪个 Provider 接入 Kimi K2？

选 OpenAI Compatible。路径：VS Code 侧边栏 Cline 图标 → 齿轮 Settings → API Provider 下拉。不要选 OpenAI（那个是直连 OpenAI 官方的）。

Q: Base URL 末尾到底加不加斜杠？

不加。填 https://api.moonshot.cn/v1，末尾不带 /。加了会导致 Cline 拼出双斜杠路径，Moonshot 网关返回 404。

Q: 输出总是写到一半就断了，不报错，怎么回事？

Max Output Tokens 可能设太大了。根据测试，Kimi K2 单次最大输出在 8192 tokens 附近，超过这个值它会静默截断（finish_reason 为 length），Cline UI 不会弹 warning。建议把 Max Output 改成 8192，或参照 Moonshot 官方文档的最新上限值。

Q: Model ID 可以填 kimi-k2 吗？

不行，必须填完整的 kimi-k2-0711-preview。简写会返回 model not found。

Q: 工具调用（function calling）一直失败怎么办？

请确认使用最新版 Cline（可在 VS Code Marketplace 或 GitHub Releases 查看当前版本）。旧版 OpenAI Compatible 模式对 tool_choice 参数的支持存在问题，升级到最新版通常可以解决。Kimi K2 对 function calling 的支持已经比较完善，但复杂嵌套工具链偶尔还是会出问题，我也不确定是 Cline 这边的序列化问题还是模型本身的局限。

Q: 报 429 Rate Limit 怎么办？

Moonshot 的免费额度有并发限制，高频调用容易触发。要么等几秒重试，要么升级付费套餐提升 QPS 上限。报错长这样：

复制代码

Error: 429 Too Many Requests
{"error":{"type":"rate_limit_error","message":"Rate limit exceeded"}}

小结

整个配置其实就 5 分钟的事，但那两个坑------apiBase 末尾斜杠导致的伪 404、maxTokens 超限导致的静默截断------没人提醒的话真能卡你一整天。尤其是静默截断，完全没有错误提示，你只会觉得"这模型怎么老是写一半就停了"，然后怀疑网络问题反复重试。

我现在日常写小功能、改 bug 都用 Kimi K2 跑 Cline，够用且便宜。遇到大活再手动切回高端模型。这套组合用了一周多，还算稳定。