VS Code 原生Github Copilot 接入Deepseek Qwen GLM Kimi Minimax模型和自定义模型

Copilot已经支持非常多的模型,为什么要接入更多的第三方模型

  • 因为Github Copilot 在2026年6月开始新的计费策略,导致订阅价格陡峭攀升;
  • 习惯了VS Code中使用Copilot的工作方式。

copilot adapter

copilot adapter不是一个独立的AI Agent工具,而是对原生Copilot Chat的增强。

项目开源地址:copilot-adapter

安装扩展

在VS Code扩展商店搜索copilot adapter然后安装或者到marketplace visualstudio页面触发安装。

copilot官方已经支持了Custom Endpoint,为什么还需要安装额外扩展?因为通过Custom Endpoint构建的模型选项无法使用视觉代理和复杂的思考模式选项。

添加模型

内置支持的模型列表: 如需其它模型请参阅自定义模型

提供商 端点平台 模型
DeepSeek platform.deepseek.com V4 Pro V4 Flash
MiniMax minimaxi.com minimax.io M3 M2.7 M2.7 Highspeed M2.5 M2.5 Highspeed M2.1 M2.1 Highspeed M2
Moonshot (Kimi) platform.moonshot.cn platform.moonshot.ai Kimi K2.7 Code Kimi K2.7 Code High-Speed Kimi K2.6 Kimi K2.5
Qwen bailian.console.aliyun.com Qwen3.7 Max Qwen3.7 Plus Qwen3.6 Max Qwen3.6 Plus Qwen3.6 Flash Qwen3.5 Plus Qwen3.5 Flash Qwen3 Max Qwen3 Coder Plus Qwen3 Coder Flash Qwen Plus (US) Qwen Flash (US)
智谱 (GLM) open.bigmodel.cn api.z.ai GLM-5.2 GLM-5.1 GLM-5 GLM-5-Turbo GLM-4.7 GLM-4.7-FlashX GLM-4.6 GLM-4.5-Air GLM-4.5-AirX GLM-4-Long GLM-4-FlashX-250414 GLM-4.7-Flash GLM-4.5-Flash GLM-4-Flash-250414 GLM-5V-Turbo GLM-4.6V GLM-OCR GLM-4.1V-Thinking-FlashX GLM-4.6V-Flash GLM-4.1V-Thinking-Flash GLM-4V-Flash

请至各提供商官网注册并获取 API Key。

本文以 DeepSeek 为例,演示通过 VS Code 语言模型面板添加提供商的完整流程------这是官方推荐的原生方式。

第 1 步 打开 Copilot Chat 的模型选择器

点击 Copilot Chat 输入框底部的模型选择器,可以看到当前可用的模型列表。此时 DeepSeek 和 MiniMax 尚未出现。

第 2 步 打开语言模型面板,点击"添加模型..."

在模型管理面板或通过 Ctrl/Cmd+Shift+P 语言模型 打开语言模型 面板,点击右上角的 + 添加模型...。安装插件后,下拉列表中会出现插件支持的提供商,选择你需要的即可。

** 第 3 步 确认分组名称 **

弹出输入框要求填写分组名称。默认已填入提供商名称,你也可以输入任意喜欢的名字,只要不与已有分组重复即可。确认后按 Enter

第 4 步 输入 API Endpoint 和 API Key

如果某个 provider 支持多个 endpoint,请先选择或输入 endpoint,如下图所示。

然后输入以 sk- 开头的 API Key 并按 Enter。Key 会立即存入 VS Code Secret Storage,不会写入磁盘或任何配置文件。

Tip:同一个 provider 支持添加多个 group,但请确保它们的 Group NameAPI Key 都不相同。

第 5 步 供应商出现在语言模型面板中

语言模型面板中现在显示 DeepSeek 分组,其下列出了两个模型。随时可点击分组名称旁的 ⚙ 图标修改 API Key 或调整配置。

第 6 步 在 Copilot Chat 中使用模型

再次打开 Copilot Chat 的模型选择器,DeepSeek V4 Flash 和 DeepSeek V4 Pro 已出现在其他模型分组下。选择其中一个即可开始对话。

安全性

API Key 仅存储于 VS Code Secret Storage,底层由操作系统凭据管理器保护------macOS 上为 Keychain,Windows 上为 Credential Manager,Linux 上为 libsecret。

  • 永远不会写入 settings.json --- Key 作为 Secret 存储,与 VS Code 设置完全隔离,不会通过 Settings Sync 同步,也不会出现在磁盘上的任何配置文件中。
  • 不可能被意外提交 --- Key 仅存在于操作系统凭据库中,不存在可被 git 追踪的文件。
  • 零运行时依赖 --- 扩展在运行时没有任何第三方库依赖或外部服务依赖,所有网络通信均使用 VS Code 内置的 HTTP 设施。

功能特性

思考模式

推理模型(DeepSeek V4 系列、MiniMax M 系列、Qwen3、GLM、Kimi K2)支持配置推理深度,可在 Language Models 面板的模型设置中调整:

级别 说明
None(无) 不进行推理步骤,输出最快
High(高) 均衡深度,适合日常编程任务
Max(最大) 全力推理,适合复杂问题

以上级别以 DeepSeek V4 为例;不同提供商的选项名称可能不同。

视觉代理

纯文本模型无法直接处理图片附件。配置视觉代理后,扩展会自动使用一个具备视觉能力的模型描述附件图片,并将描述以文本形式注入上下文,从而让纯文本模型也能无缝处理图片输入。

通过命令 Copilot Adapter: Set Vision Proxy Model 或设置项 copilot-adapter.visionProxyModel 进行配置。

将值设为 off 即可随时禁用。

前缀缓存命中率

扩展会调整连续对话中消息的顺序,优先将可以被缓存的内容放在前面,以提升支持前缀缓存和主动缓存的模型(DeepSeek、Qwen、Zhipu)的缓存命中率。在日志级别为 info 或更高时,输出频道中会记录每次请求的缓存命中详情:

yaml 复制代码
model: deepseek-v4-pro, tokens: prompt=18576 reasoning=40 completion=57, cache: hit=12160 miss=6516 rate=65%

上下文窗口计算

扩展会为每次请求向 VS Code 上报 Token 用量,具体策略分为两种:

  • API 返回用量 (DeepSeek、Qwen、Zhipu、Moonshot)------ 模型在流式响应中返回精确的 prompt_tokenscompletion_tokens。这是主要路径,无需估算。

  • 降级估算(MiniMax 等不返回流式用量的提供商)------ 当 API 未包含用量数据时,扩展通过请求和响应文本的字符数估算 Token 用量。日志中会标明降级模式:

    yaml 复制代码
    Using fallback usage estimation (API returned no usage data) --- prompt chars: 15234, response chars: 487

动态比例校准

provideTokenCount(VS Code 的上下文窗口计算)使用的字符/Token 比例初始为 4.0,会根据每次 API 返回的真实用量自动校准。每次返回精确用量的请求都会用 EMA 平滑方式(旧值 80%、新值 20%)更新比例。为避免噪声,仅当变化 ≥ 10% 时才会存储:

vbnet 复制代码
Chars-per-token ratio calibrated for deepseek: 4.00 to 3.38 (based on API usage: 63200 chars / 18703 tokens)

无法获取精确用量的提供商(如 MiniMax)保持静态默认比例。

自定义模型

自定义模型的功能提供了可以自行配置不在内置模型列表的模型

VS Code Copilot Chat 官方的 Custom Endpoint 仅支持基础的模型配置(名称、端点、API Key),无法使用视觉代理、定制化思考模式和缓存命中率日志。Copilot Adapter 的 Custom Models 填补了这些缺口:

  • 视觉代理 --- 纯文本模型也能通过自动视觉代理管线处理图片附件。
  • 可定制的思考模式 --- 针对不同厂商的请求体格式(DeepSeek、Qwen、Anthropic 等)配置各模型的推理强度,在模型选择器中即可切换。
  • 缓存命中率日志 --- 在输出频道中查看每次请求的前缀缓存命中/未命中率。

通过在配置文件中定义元数据(名称、端点、能力、token 限制),可将任意兼容 OpenAI 接口的模型接入 Copilot Chat。思考模型("thinking": true)会根据模型 ID 自动匹配预置的推理强度配置,同时支持完整自定义。

详细图文教程请参阅(如何添加自定义模型)涵盖 DeepSeek、OpenAI、Anthropic、通义千问、智谱、MiniMax、Gemini、Grok 等的即用型模板见 custom-models-template)。

实测的缓存命中率

相关推荐
tonydf3 天前
DotNet项目接入Copilot SDK简单案例
后端·.net·github copilot
虎妞05006 天前
AI 编程助手横评:Cursor vs Copilot vs Claude Code
ai编程·开发工具·cursor·github copilot·claude code
hoaxxcj6 天前
AI编程2026:Copilot桌面应用发布,我们正在经历一场不可逆的范式转移
copilot·agent·ai编程·github copilot·编程工具
程序员差不多先生10 天前
Copilot 取消年费改按量计费:AI Coding 工具进入了什么新阶段?
人工智能·copilot·github copilot
ServBay17 天前
别管跑分了,2026 本地编程大模型推荐与 GitHub Copilot 免费平替
llm·ai编程·github copilot
领驭出海云服务1 个月前
GitHub Copilot Token计费时代来临:团队如何优化AI编程成本?
github copilot
XD7429716362 个月前
科技早报|2026年5月2日:AI 编程工具开始按用量收费
人工智能·科技·ai编程·github copilot·科技早报
带娃的IT创业者2 个月前
Zig 项目反AI贡献政策:一场关于开源灵魂的保卫战
人工智能·开源·ai编程·代码质量·github copilot·zig