【星海出品】防止大模型强依赖(二)

真理有其时间、范围、和对象的限制：The Article was writing in 2026-04-29

我使用的是VScode + Cline

下载的最新版的VScode

bash 复制代码

https://code.visualstudio.com/updates/v1_118

MiMo

https://platform.xiaomimimo.com/docs/zh-CN/welcome

百万Token激励活动: https://100t.xiaomimimo.com/

Cline 选择 api-key 的方式

填写BaseURL 到 OneAPI 、 OpenRouter 、 New API 、LiteLLM 等

✅ Supports Images

作用：告知 Cline 你使用的模型是否支持多模态识别（视觉），即能否"看懂"图片，并基于图片内容进行思考和回答。

如果这个模型本身不支持图片输入（大多数纯文本模型都不支持），请不要勾选，否则 Cline 可能会尝试发送图片导致请求失败。

✅ Enable R1 messages format

作用：专门针对 DeepSeek-R1 系列模型（如 deepseek-reasoner）设计。这类模型会输出"推理过程"和"最终答案"，开启此选项后 Cline 会按特殊格式解析并展示模型内部的思考链（Chain of Thought，即模型在得出最终答案前进行的中间推理步骤），提升可读性。

不是 R1 系列, 此功能很可能不生效，甚至可能导致解析异常。

☑️ Context Window Size（上下文窗口大小）

作用：告诉 Cline 你的模型一次能处理多少 token（约等于字符数的概念）。如果设置过大，实际模型能力不足可能导致截断或报错；设置过小则浪费模型能力。

模型的上下文长度取决于你运行时的配置（常见为 128K 或 32K）

☑️ Max Output Tokens（最大输出 token 数）

作用：限制模型一次回答的最大长度。填大于 0 的数值（如 4096）表示硬性限制；填 -1 则表示不作限制，模型按自身能力输出。

若不设限可能导致单次回答极长，但不影响稳定。填 -1 是安全且通用的做法。

☑️ Input Price / 1M tokens 和 Output Price / 1M tokens

作用：用于 Cline 估算本次会话的费用（显示在界面上）。这些值不会影响实际调用，仅用于本地统计。

☑️ Temperature

作用：控制模型回答的随机性/创造性。数值范围一般是 0~2。

0：最确定、最保守，每次回答几乎一样（适合编程、固定任务）。

更高值（如 0.7~1）：更有"想象力"，但可能不稳定。

建议：保持 0 或微调至 0.2。

选项「Use different models for Plan and Act modes」的作用是允许你在 Cline 的 Plan（计划）和 Act（执行）两种模式下使用不同的模型。

关闭（默认）：Plan 模式和 Act 模式使用同一个模型（就是你之前配置的那个模型）。

开启：你可以分别为 Plan 模式和 Act 模式配置不同的模型和 API。切换模式时，Cline 会自动切换对应的配置。

有多个模型，且想分场景使用 ✅ 可以勾选并分别配置