真理有其时间、范围、和对象的限制:The Article was writing in 2026-04-29
我使用的是VScode + Cline
下载的最新版的VScode
bash
https://code.visualstudio.com/updates/v1_118
MiMo
https://platform.xiaomimimo.com/docs/zh-CN/welcome
百万Token激励活动: https://100t.xiaomimimo.com/
Cline 选择 api-key 的方式
填写BaseURL 到 OneAPI 、 OpenRouter 、 New API 、LiteLLM 等
http://你的服务器IP:端口/v1

✅ Supports Images
作用:告知 Cline 你使用的模型是否支持多模态识别(视觉),即能否"看懂"图片,并基于图片内容进行思考和回答。
如果这个模型本身 不支持图片输入(大多数纯文本模型都不支持),请不要勾选,否则 Cline 可能会尝试发送图片导致请求失败。
✅ Enable R1 messages format
作用:专门针对 DeepSeek-R1 系列模型(如 deepseek-reasoner)设计。这类模型会输出"推理过程"和"最终答案",开启此选项后 Cline 会按特殊格式解析并展示模型内部的思考链(Chain of Thought,即模型在得出最终答案前进行的中间推理步骤),提升可读性。
不是 R1 系列, 此功能很可能不生效,甚至可能导致解析异常。
☑️ Context Window Size(上下文窗口大小)
作用:告诉 Cline 你的模型一次能处理多少 token(约等于字符数的概念)。如果设置过大,实际模型能力不足可能导致截断或报错;设置过小则浪费模型能力。
模型的上下文长度取决于你运行时的配置(常见为 128K 或 32K)
☑️ Max Output Tokens(最大输出 token 数)
作用:限制模型一次回答的最大长度。填大于 0 的数值(如 4096)表示硬性限制;填 -1 则表示不作限制,模型按自身能力输出。
若不设限可能导致单次回答极长,但不影响稳定。填 -1 是安全且通用的做法。
☑️ Input Price / 1M tokens 和 Output Price / 1M tokens
作用:用于 Cline 估算本次会话的费用(显示在界面上)。这些值不会影响实际调用,仅用于本地统计。
☑️ Temperature
作用:控制模型回答的随机性/创造性。数值范围一般是 0~2。
0:最确定、最保守,每次回答几乎一样(适合编程、固定任务)。
更高值(如 0.7~1):更有"想象力",但可能不稳定。
建议:保持 0 或微调至 0.2。
选项 「Use different models for Plan and Act modes」 的作用是允许你在 Cline 的 Plan(计划) 和 Act(执行) 两种模式下使用不同的模型。
关闭(默认):Plan 模式和 Act 模式使用同一个模型(就是你之前配置的那个模型)。
开启:你可以分别为 Plan 模式和 Act 模式配置不同的模型和 API。切换模式时,Cline 会自动切换对应的配置。
有多个模型,且想分场景使用 ✅ 可以勾选并分别配置