IDEA配置Continue

（Java + 32G内存无独显 + 代码绝不上传云端 ），唯一且最优解是：Continue + Ollama + 本地量化代码模型。其他三款默认依赖云端推理，不符合隐私红线。

下面给你一套 开箱即跑、零外网依赖、针对Java优化 的完整落地方案：

🧩 为什么选这个组合？

你的要求	方案匹配度
`Java语言`	本地跑 `Qwen2.5-Coder` 系列，Java代码理解/生成/重构能力目前开源第一梯队
`32G内存/无独显`	CPU推理完全可行，7B量化模型仅需 4~5GB 内存，留出 25GB+ 给 IDEA 和系统
`不接受代码上传云端`	Ollama 监听 `127.0.0.1:11434`，Continue 直连本地端口，物理断网也能用，0字节外发

🛠️ 一键部署步骤（约10分钟）

1. 安装本地推理引擎：Ollama

官网：https://ollama.com
下载对应系统版本，安装后终端运行：
复制代码
复制代码
```
ollama run qwen2.5-coder:7b-instruct-q4_K_M
```
✅ 首次会自动下载约 4.2GB 模型。下载完成后输入 /bye 退出，Ollama 会后台常驻。

2. IDEA 安装 Continue 插件

Settings → Plugins → Marketplace → 搜索 Continue → Install → Restart

3. 配置 Continue 指向本地模型

打开 Continue 配置：点击侧边栏 ⚙️ → Open Config，替换为以下精准配置：

复制代码

{
  "models": [
    {
      "title": "Java本地助手",
      "provider": "ollama",
      "model": "qwen2.5-coder:7b-instruct-q4_K_M",
      "contextLength": 4096,
      "maxTokens": 2048
    }
  ],
  "tabAutocompleteModel": {
    "title": "Java自动补全",
    "provider": "ollama",
    "model": "qwen2.5-coder:7b-instruct-q4_K_M",
    "contextLength": 2048
  },
  "customCommands": [
    {
      "name": "java-refactor",
      "prompt": "作为Java架构师，请重构以下代码：保持原有逻辑，提升可读性/性能/符合Spring规范，输出完整代码块。"
    }
  ],
  "docs": [],
  "disableIndexing": false,
  "indexing": {
    "maxFileSize": 500,
    "pathsToIgnore": ["**/target/**", "**/.idea/**", "**/build/**", "**/*.class"]
  }
}

⚙️ 针对你的硬件与Java场景的调优建议

优化项	操作	效果
避免CPU过载	将 `tabAutocompleteModel.contextLength` 设为 `2048`，聊天设为 `4096`	内存稳定在 5GB 内，IDEA 不卡顿
补全延迟控制	IDEA 设置：`Settings → Editor → General → Code Completion → Autopopup code completion in` 取消勾选，改为 `Ctrl+空格` 手动触发	避免CPU频繁推理导致打字卡顿
Java项目索引加速	Continue 配置中 `pathsToIgnore` 已排除 `target/` 和 `*.class`，首次索引会扫描 `src/`，耗时约1~3分钟	避免索引编译产物浪费内存，精准匹配源码
断网/隐私验证	用 `netstat -ano	findstr 11434`（Win）或` lsof -i :11434`（Mac/Linux）确认仅监听` 127.0.0.1`

📉 性能预期管理（无独显+CPU推理）

补全响应：约 1~3 秒/次（取决于CPU代数，12代酷睿/Ryzen 5000+ 体验流畅）
聊天生成：约 10~20 tokens/秒（足够日常问答/解释/重构）
内存占用：Ollama进程 4.5GB + IDEA ~24GB + 系统 6GB ≈ 总占用 1215GB（32G完全够用）
建议工作流 ：日常用 Ctrl+I 手动呼出补全；复杂重构/单元测试用侧边栏 Chat；大文件修改前先用 @file 指定上下文。

🔍 备选方案（如果你嫌 Continue 配置繁琐）

CodeGeeX 本地版 ：智谱提供 CodeGeeX4 本地部署包（基于 llama.cpp），插件体验更"开箱即用"，但需自行打包模型，上手门槛略高于 Ollama。
JetBrains AI + 私有网关：企业采购后可对接内部模型服务，但个人开发者不适用。

✅ 下一步

如果你运行 ollama run qwen2.5-coder:7b-instruct-q4_K_M 后遇到：

下载慢/卡顿 → 可换国内镜像站（如 https://ollama.modelscope.cn）
IDEA 中补全不触发 → 检查 Settings → Advanced Settings → AI Assistant 冲突项

优化脚本

针对 Windows + Intel i5 + 32GB内存 + 无独显 的硬件组合，CPU 推理完全可行，但需做好 内存带宽优化、电源策略调整、进程隔离 。下面是为你定制的 Windows 专属落地方案，复制粘贴即可跑通：

🖥️ 第一步：Windows 环境一键配置（PowerShell 管理员）

复制代码

# 1. 设置 Ollama 仅监听本地，限制并行数防 i5 过载
[Environment]::SetEnvironmentVariable("OLLAMA_HOST", "127.0.0.1:11434", "User")
[Environment]::SetEnvironmentVariable("OLLAMA_NUM_PARALLEL", "1", "User")
[Environment]::SetEnvironmentVariable("OLLAMA_KEEP_ALIVE", "3m", "User")

# 2. 重启资源管理器使环境变量生效（或重启电脑）
Stop-Process -Name explorer -Force

# 3. 安装 Ollama（自动检测架构）
winget install Ollama.Ollama
# 或手动下载：https://ollama.com/download/windows

# 4. 拉取 Java 优化模型（Q4量化版，约4.2GB）
ollama pull qwen2.5-coder:7b-instruct-q4_K_M

# 5. 验证本地服务（应仅显示 127.0.0.1:11434）
netstat -ano | findstr 11434

💡 注意：若你的 i5 是 双通道内存（2×16GB），CPU 推理速度可提升 30%~50%；单通道建议后续加一条同频内存条。

⚙️ 第二步：Continue 配置（Windows 路径 + Java 专属）

打开配置：IDEA 侧边栏 Continue → 点击右上角 ⚙️ → Open Config
替换为以下内容（Windows 路径已适配）：

复制代码

{
  "models": [
    {
      "title": "Java本地助手",
      "provider": "ollama",
      "model": "qwen2.5-coder:7b-instruct-q4_K_M",
      "contextLength": 4096,
      "maxTokens": 1500
    }
  ],
  "tabAutocompleteModel": {
    "title": "Java补全",
    "provider": "ollama",
    "model": "qwen2.5-coder:7b-instruct-q4_K_M",
    "contextLength": 2048,
    "maxTokens": 512
  },
  "customCommands": [
    { "name": "java-fix", "prompt": "作为高级Java工程师，请指出以下代码的潜在Bug/性能瓶颈/线程安全问题，并给出修复方案。" },
    { "name": "java-test", "prompt": "为以下Java代码生成JUnit5单元测试，覆盖正常/边界/异常分支，使用Mockito。" }
  ],
  "docs": [],
  "disableIndexing": false,
  "indexing": {
    "maxFileSize": 500,
    "pathsToIgnore": [
      "**/target/**", "**/build/**", "**/.gradle/**",
      "**/*.class", "**/*.jar", "**/node_modules/**",
      "**/test/**", "**/resources/**"
    ]
  }
}

📁 配置保存路径：C:\Users\<你的用户名>\.continue\config.json

🚀 第三步：i5 CPU 专属调优（必做，否则卡顿）

优化项	操作	效果
Windows 电源计划	`控制面板 → 电源选项 → 高性能`（或创建自定义：最小/最大处理器状态 100%）	防止 CPU 降频导致推理延迟飙升
IDEA 补全策略	`Settings → Editor → General → Code Completion`<br>✅ 取消 `Autopopup code completion in`<br>✅ 勾选 `Show suggestions as you type`（仅显示，不自动插入）	i5 无法扛住实时高频推理，改为 `Ctrl+I` 手动触发
Ollama 内存释放	配置中 `OLLAMA_KEEP_ALIVE=3m` 已设置，模型空闲 3 分钟自动卸载	避免长期占用 4.5GB 内存影响 IDEA GC
Defender 排除	`Windows安全中心 → 病毒和威胁防护 → 管理设置 → 排除项`<br>添加文件夹：`~/.ollama/models` 和 `C:\ProgramData\Ollama`	防止实时扫描拖慢模型加载速度

🔒 第四步：隐私断网验证（Windows）

复制代码

# 1. 确认 Ollama 仅监听本地
netstat -ano | findstr LISTENING | findstr 11434
# 正常输出：TCP  127.0.0.1:11434  0.0.0.0:0  LISTENING

# 2. 防火墙彻底封死外连（可选但推荐）
New-NetFirewallRule -DisplayName "Block Ollama Outbound" -Direction Outbound -Program "C:\ProgramData\Ollama\ollama.exe" -Action Block

✅ 完成此步后，即使拔掉网线/关闭WiFi，Continue 补全和 Chat 仍可正常工作，0 字节代码外发。

📉 性能预期（i5 + 32G + CPU推理）

补全响应 ：0.8~2.5秒/次（取决于 i5 代数，10代+体验流畅）
聊天生成 ：8~15 tokens/秒（解释/重构/写注释完全够用）
内存占用峰值 ：Ollama(4.5G) + IDEA(3~4G) + 系统(6G) ≈ 13.5G（32G 余量充足）
建议工作流 ：日常写业务逻辑用 Ctrl+I 手动补全；复杂重构/单元测试用侧边栏 @file 指定上下文；避免同时打开多个大项目。

🆘 常见问题预判

现象	原因	解决
补全延迟 >3秒	CPU 降频 / 后台程序抢资源	电源计划改高性能，关闭 Chrome/微信等内存大户
Continue 侧边栏报错 `401`	Ollama 服务未启动	`ollama serve` 手动启动，或重启电脑
索引 Java 项目后 IDEA 卡顿	扫描了 `target/` 或 `*.class`	检查 `config.json` 的 `pathsToIgnore` 是否生效
模型加载失败 `GPU not available`	Ollama 默认尝试调用集显	已强制 CPU 模式，忽略此 warning 即可

✅ 下一步

按顺序执行 PowerShell 脚本 → 安装插件 → 粘贴配置 → 改电源计划
打开任意 Java 项目，输入 public class 后按 Ctrl+I 测试补全
侧边栏输入 @src 请解释 Spring Boot 启动流程 测试 Chat