【一站式】本地部署Gemma 4 + 连接OpenCode

前言

Gemma 4 和OpenCode 的 太搭了,配置容易,实际使用体验也非常不错(综合体感优于原来折腾GLM + Claude Code Router+ Claude Code),有一定本地算力的话,值得推荐。

目录

一、本地部署Gemma 4

安装Python并创建虚拟环境

安装Python,环境用venv隔离一下。

下载模型

国内优先Modelscope,速度杠杠的。模型我用的31B,可以按自己算力情况调整。另外,配合agent使用的话,优先选it版本,是针对对话做过优化的:google/Gemma-4

激活venv虚拟环境后,安装ModelScope环境,慢的话切一下国内源:

bash 复制代码
pip install modelscope

下载模型,取决于你的网速,我能把带宽跑满 (接近400Mbps):

bash 复制代码
modelscope download --model google/gemma-4-31B-it --local_dir ./你的目录

如果要下特定文件:

bash 复制代码
modelscope download --model google/gemma-4-31B-it 要单独下的文件 --local_dir ./你的目录

安装vLLM

激活venv虚拟环境后,安装vLLM环境,慢的话切一下国内源,要支持Gemma 4,需要的vLLM版本比较新,我用的0.19.1:

bash 复制代码
pip install vllm=0.19.1

部署模型

在A6000 48G * 2实际成功的参数如下,IP、端口等各种参数自己替一下:

bash 复制代码
CUDA_VISIBLE_DEVICES=0,1 vllm serve /home/leon/workspace/gpt/gemma-4-31B-it \
--tensor-parallel-size 2 \
--dtype bfloat16 \
--max-model-len 200000 \
--gpu-memory-utilization 0.85 \
--enable-auto-tool-choice \
--tool-call-parser gemma4 \
--reasoning-parser gemma4 \
--host 192.168.1.53 \
--served-model-name gemma-4-31b-it \
--port 8000

启动碰到恶心的Failed to import Triton kernels的话,参考这里解决,在最底部:Bug: Failed to import Triton kernels. Please make sure your triton version is compatible. Error: cannot import name 'SparseMatrix' from 'triton_kernels.tensor'

二、Opencode安装及配置

安装OpenCode

不用科学上网也很丝滑,详细过程参见OpenCode官网或自行搜索。

bash 复制代码
npm install -g opencode-ai

配置OpenCode

C:\Users\你的用户名\.config\opencode\opencode.json中 (Linux和Mac就是/home/你的用户名目录下类似路径) 进行如下配置,注意模型、IP、端口号要与你在上面配置的一致:

json 复制代码
{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "vllm": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "vLLM (local)",
      "options": {
        "baseURL": "http://192.168.1.53:8000/v1/"
      },
      "models": {
        "gemma-4-31b-it": {
          "name": "gemma-4-31b-it"
        }
      }
    }
  },
  "model": "vllm/gemma-4-31b-it",
  "small_model": "vllm/gemma-4-31b-it",
}

在同路径下创建auth.json

json 复制代码
{
 "vllm": {
   "type": "api",
   "key": "sk-local"
 }
}

三、使用OpenCode调用本地部署模型

一切就绪后在你的项目目录下启动OpenCode,推荐在VS Code的终端启动,可输入中文提示词(在Linux原生shell启动OpenCode后不支持中文):

bash 复制代码
opencode

启动后可以看到,连的确实是我们的本地模型了。

Enjoy it~

Ref:

https://www.modelscope.cn/collections/google/Gemma-4

https://opencode.ai/docs/

相关推荐
HIT_Weston2 天前
110、【Agent】【OpenCode】todowrite 工具提示词(示例)(四)
人工智能·agent·opencode
sg_knight2 天前
openCode、Claude Code、Cursor、Copilot,到底怎么选
llm·agent·ai编程·claude·codex·opencode·claude-code
HIT_Weston3 天前
107、【Agent】【OpenCode】todowrite 工具提示词(示例)(一)
人工智能·agent·opencode
无忧.芙桃3 天前
vibe coding之opencode的使用
ai·单元测试·opencode
碳基硅坊4 天前
Gemma-4-31B推理加速:量化、框架与加速技术实战
人工智能·gemma·模型加速·gemma4·gemma4-31b
逢着4 天前
Opencode + Superpowers 真实使用过程
agent·code·opencode·superpowers
2601_955781985 天前
Windows 环境快速部署 Hermes 智能 Agent,规避环境配置各类坑点
人工智能·本地部署·教程分享·hermes·hermes部署
HIT_Weston5 天前
104、【Agent】【OpenCode】webfetch 工具提示词
人工智能·agent·opencode
带娃的IT创业者8 天前
单比特奇迹:如何在本地设备运行 4B 图像生成模型?
ai·图像生成·模型量化·本地部署·低资源推理
HIT_Weston8 天前
99、【Agent】【OpenCode】task 工具提示词(Slash command)(一)
人工智能·agent·opencode