AI笔记002.主流 AI 编程工具检索技术一览表

2026-03-27：

工具	核心技术	向量索引机制	语义理解	精确匹配能力	实时性	资源占用	扩展方式	离线可用性	首次索引速度	大型单体仓库支持能力	Token 消耗
Cursor	动态上下文发现 + 混合检索	本地索引（Git）+ 相似性哈希	高	极高	极高	极低（<100MB 常驻）	支持 MCP	完全离线（语义搜索需下载模型）	极快（秒级，基于 Git）	良好（万级文件可工作，但语义索引会变慢）	低
Claude Code	混合检索（ripgrep + 可选语义）	默认无索引，可选本地 embedding	中高	极高	完美	极低	支持 MCP	完全离线（语义索引需首次构建）	即时（无索引）	优秀（无索引模式下几乎无上限）	低
Codex	云端多 Agent 并行 + 沙箱隔离	云端索引（预加载代码库）	高	中	中（委派模式）	极低	CLI / IDE 插件 / App 三入口	不可离线	中--慢（首次同步需上传仓库）	优秀（云端可处理超大规模仓库，支持 worktree 并行）	低--中（3--5 倍低于 Claude，但云端语义有开销）
Warp	终端原生 Agent + 混合检索 + 模型路由	本地会话索引 + 云端可选（Oz cloud）	中高	高	高（本地）/ 中（云端）	极低--低	支持 MCP（实验性）	部分离线（本地终端可离线，语义依赖云端）	即时（无索引，基于终端会话）	良好（终端上下文天然精简，智能截断/摘要）	极低--低
OpenCode	纯词法（ripgrep）	无索引	低	极高	完美	极低	支持 MCP	完全离线	即时	优秀（无索引，仅受 ripgrep 扫描速度限制）	极低
Aider	repo map + AST 分析	动态文件映射	中	极高	高	低	支持 MCP	完全离线	极快（首次扫描文件树）	良好（repo map 会因文件数增大而增加 token）	极低
Windsurf（Cascade）	混合检索 + 主动上下文	云端索引 + 本地缓存	极高	高	中	低	有限支持	受限（核心能力依赖云端）	中（依赖云端同步）	良好（云端可扩展，但首次同步慢）	中
VSCode + Continue	混合检索	LanceDB / Chroma 本地向量库	高	中	中	高	实验性 MCP	部分离线（可全本地部署模型）	慢（需全量构建向量索引）	差--中等（单体仓库索引构建极慢，内存爆炸风险）	高
VSCode + Cline	AST 依赖追踪 + ripgrep	无持久索引	低	极高	高	中	支持 MCP	完全离线	极快（实时解析）	良好（依赖图解析可能在大仓库变慢）	中
Augment	云端语义索引 + 重排序模型	云端向量索引（代码库级）	极高	高	中	极低	插件机制	不可离线	中--慢（首次同步需上传并索引仓库）	优秀（云端索引可处理超大规模仓库）	中
Trae	混合检索（ripgrep + 轻量语义）	本地索引（基于 SQLite + 轻量向量）	中高	高	高	低	插件机制	部分离线（语义索引需下载模型）	快（首次索引基于 ripgrep 快速扫描）	良好（语义索引在万级文件下可控）	低--中
GitHub Copilot	云端大模型 + 上下文补全	无本地索引，依赖 IDE 提供打开文件上下文	高	中低	极高（补全）/ 中（对话）	极低	插件机制（VS / JetBrains / CLI）	不可离线（核心推理依赖云端）	不适用（无本地索引）	差（无法感知仓库全貌，仅依赖当前打开文件）	中--高（对话场景按 token 计费/限流）
CodeBuddy	混合检索 + AST 分析 + 动态上下文	本地轻量索引 + 可选云端向量库	中高	高	高	低	支持 MCP、Plugin 插件市场	部分离线（语义索引需下载模型）	快（首次扫描基于文件树）	良好--优秀（万级文件可控，企业版云端扩展）	低

📊 使用量排序逻辑说明

用户规模与市场渗透率
- GitHub Copilot：最早进入市场，背靠微软+GitHub 生态，数百万级用户，稳居第一
- CodeBuddy：腾讯内部 1.2 万工程师 + 50 余家企业客户，国内企业市场渗透率高
- Cursor：AI 原生 IDE 赛道头部，开发者社区热度极高
- Claude Code：2025 年引爆"代理式编程"概念，专业开发者圈层影响力大
- Codex：虽用户基数受限于 ChatGPT 订阅，但 OpenAI 品牌效应强，开发者关注度高
- Warp：终端赛道差异化定位，在 DevOps/SRE 圈层有稳定用户群
- 其他工具：多为开源或垂直领域，规模相对较小
产品形态与生态位
- IDE 插件（Copilot）> 独立 IDE（Cursor）> CLI Agent（Claude Code/CodeBuddy）> 垂直工具（Warp/Trae）
团队采用趋势
- 企业级采购首选：Cursor Teams
- 专业开发者"双持"模式：Cursor + Claude Code / Cursor + Codex 渐成主流

📌 补充说明

全面支持语义索引
- 虽以 ripgrep 为主，但均已支持可选语义索引
- 凡支持语义的，均采用"精确优先、语义兜底"的混合策略。
资源占用
- 极低：工具本身内存 <100MB，无持久索引或索引 mmap 按需加载。
- 中高：向量库需常驻内存（如 Continue 加载 Chroma 可能占用 1--2GB）。
关于省token
- OpenCode：纯 ripgrep，按需传递精确匹配片段，无额外语义开销。
- Aider：repo map 以精简的 AST 符号摘要为核心，被公认为最省 token 的上下文方案之一。
Windsurf 的独特定位
- Windsurf 的"Flow"模式强调 IDE 主动预取上下文，其语义重排模型（由 Codeium 自研）在实际体验中优于大部分开源方案，但实时性受云端延迟影响。