本地部署与实践指南：构建免费的AI开发助手系统（Claude Code + Ollama）

本文指南旨在阐述一个革命性的本地化、零成本、高可控的AI开发助手系统。我们结合了功能强大的 Claude Code Agent 框架（负责复杂的流程规划和决策逻辑）与本地化、经济高效的 Ollama 模型（提供底层计算能力），从而实现一个完全免费运行的AI开发助手，彻底绕开了昂贵的外部商业API费用。

💡 核心概念与解决的问题（Core Concept & Problem Solved）

【原始痛点 Analysis】

Claude Code 是一个能力强大的 Agent 框架，它远超一般的聊天机器人。它的核心能力包括：阅读整个项目结构、修改文件内容、执行终端命令、自动修复代码 Bug 等，这些能力在软件开发工作流中具有革命性意义。然而，使用其官方的 Claude API 进行深度、多次迭代的开发工作流时，其费用成本是难以承受的"沉没成本"。

【我们的解决方案 Solution】

本项目提出了一种优雅的解决方案：

使用 Ollama 实现本地化执行： 将本地的开源 LLM（如 Qwen, Gemma, Deepseek 等）作为核心"大脑"。
引入 CC Switch 作为 API 转发层 (API Forwarding Layer)： 这是一个关键的中间件（Bridge）。它让 Claude Code 误以为它正在调用官方的 Claude API，但实际上，所有的 API 请求都会被透明地、秘密地路由和重定向到本地运行的 Ollama 服务端点。

核心理念： 解耦 AI 的"决策大脑"与"计算引擎"的物理分离。

🚀 Agent 的本质区别（The "Agent" Difference）

理解 Agent 与传统 AI 的区别至关重要：

传统 AI (Simple Q&A)： 仅停留在问答、文本生成层面，缺乏主动性和行动力。
Claude Code Agent (Full Development Cycle)： 真正执行一个完整的、模拟开发人员的生命周期。它具备以下能力：
1. 项目感知： 能够读取和消化整个项目目录结构（如 src/、components/、package.json 等）。
2. 自主迭代： 分析代码缺陷、自动修改文件、执行依赖安装命令、并迭代修复 Bug。

结论： 这个过程不是一次简单的聊天；它是一个集 AI 智能决策 + 交互式开发环境 (IDE) + 终端操作 (Terminal) 于一体的自动化开发循环。

🛠️ 本地化部署分步指南（Step-by-Step Local Deployment Guide）

目标：实现 100% 免费的本地部署。

1. 前置条件 (Prerequisites)

Git: 确保本地已安装 Git 版本控制工具。

2. 核心工具下载与配置 (Core Tools Acquisition)

工具名称	作用 (Purpose)	关键用途与注意事项 (Notes)
Claude Code Desktop	主 Agent 界面。负责提供用户交互的图形化界面，作为整个开发工作流的控制前端。	https://claude.com/download
Ollama Client	本地 LLM 计算引擎。负责运行所有本地的、开源的大语言模型 (如 Qwen, Gemma, Deepseek R1, GLM)。所有推理计算在此完成。	https://ollama.com/
CC Switch	关键的 API 转发中间件 (The Bridge)。这是实现整个"骗局"的核心，负责拦截和重定向 API 请求。	https://github.com/farion1231/cc-switch

3. 本地模型推荐 (Ollama Model Recommendations)

模型选择应基于本地设备的 GPU VRAM 资源：

首选模型： Qwen 3.6/3.5、Gemma4、Deepseek R1、GLM 等。
建议： 选择与本地硬件资源兼容性最好的模型版本。

4. CC Switch 配置详解 (Configuration Details)

这是连接线上 Agent 和本地模型的"网络协议"：

请求地址 (Request Address): 必须设置为 http://127.0.0.1:11434/v1。
API 格式 (API Format): 必须遵循 OpenAI Chat Completions 的标准模式，以确保 Claude Code 能够识别请求格式。
认证字段 (Authentication Field): 前端配置中可能会需要一个 Key 占位符，即使不用于认证，也应设置 ANTHROPIC_API_KEY 以满足格式要求。

5. Claude Code 注册表注入（最关键步骤）

为了确保本地模型的使用不会被 Agent 的界面逻辑所忽略，必须修改 Claude Code 的自定义配置文件：

原配置示例：
"inferenceModels"="[\"haiku\",\"sonnet\",\"opus\"]"

修改目标：
"inferenceModels"="[\"haiku\",\"sonnet\",\"opus\"]"
(在实际操作中，需确保此处能兼容本地模型的显示或模拟显示)

🧠 技术深入解析：转发机制 (Technical Deep Dive: The Forwarding Mechanism)

拦截 (Interception): Claude Code Agent 发送所有 API 请求（它认为发送给 Claude API）。
重定向 (Redirection): CC Switch 代理层拦截了这个请求的全部内容。
转发 (Forwarding): CC Switch 识别出目标是开发流程，并将其透明地、无缝地重定向到本地的 Ollama API 端点 (http://127.0.0.1:11434/v1)。
结果： Claude Code 永远不知道自己在与本地 Ollama 引擎对话，它只接收到了一个格式完美，且符合预期的"Claude 高级 API"的回复。

通过这套架构，开发者即可拥有一个完全免费、功能媲美付费版本的本地AI开发助手。