Codex+本地Qwen3.5无审查实用案例分享及llama对接踩坑。

大家好,这里是硅谷茶馆。今天和大家分享一个让本地大模型真正帮上忙的实用方案------用 Ollama 结合 OpenAI 的 Codex 工具,在自己电脑上运行 AI 编程助手。

前段时间我们刚分享完Qwen35B的开源无审查模型,今天就把我实践结果分享给大家。过去,AI 辅助编程大多依赖云端服务,长时间使用容易产生费用。本地化方案可以减少对网络和费用的依赖,让开发者在断网环境下也能完成一些代码相关任务。下面我们聊聊实际可行的部署方式。

一、AI Agent 与普通聊天机器人的区别

Agent场景操作:

二、基础部署步骤

以下是简单上手流程,适合有一定命令行基础的朋友操作。

第一步:安装 Codex 客户端前往 OpenAI 开发者官网下载对应系统的 Codex App(支持 Mac 和 Windows)。 安装后先不要用云端账号登录,直接跳过或关闭登录,保持本地模式。

第二步:更新 Ollama确保 Ollama 版本在 0.24 或以上。 在终端输入 ollama -v 检查版本,如果过旧,请到 Ollama 官网下载最新安装包覆盖安装。因为ollama很大,可以使用指定目录安装。下载好本地版本,用下面命令安装

powershell 复制代码
#指定程序安装目录
.\OllamaSetup.exe /DIR="F:\Ollama"
#再添加模型路径环境变量(同上OLLAMA_MODELS)

第三步:下载合适模型推荐根据显存选择模型,例如 Qwen 系列或 Gemma 系列。

常用命令示例(Windows/Linux):ollama run qwen3:27b或更轻量的版本。

Mac 用户可选择 MLX 优化版本以提升速度。

第四步:启动本地对接执行以下命令(以 qwen3.6模型为例):

ollama launch codex-app --model qwen3.6

终端提示重启 Codex 时选择确认。重启后,界面会显示已连接本地模型。

三、实际案例应用分享

测试1:修复BUG(幽灵会穿墙、卡墙、不会追击小黄)

修复后:幽灵会不会卡墙了,也知道追踪小黄

修复后,真的可以玩了:

测试2:开发一个新游戏

游戏展示:

游戏整体还可以,而且我只是给了一句话的prompt,它完成的很好,火力、等级、飞机样式、攻击、还有敌人的血条,完成的还是可以

四、踩坑

看了很多分享说使用llama直连或者直接代理走codex本地推理,完全不可行(个人实验多次),各种报错如下:

1、写法错误

css 复制代码
failed to resolve feature override precedence: legacy `profile = "llamacpp-codex"` config is no longer supported; use `--profile llamacpp-codex` with `llamacpp-codex.config.toml` instead

2、接口不被支持

sql 复制代码
Unable to generate parser for this template. Automatic parser generation failed: ------------ While executing CallExpression at line 85, column 32 in source: ...first %}↵ {{- raise_exception('System message must be at the beginnin... ^ Error: Jinja Exception: System message must be at the beginning.

3、jinjia模版异常

nginx 复制代码
invalid configuration: `wire_api = "chat"` is no longer supported.
How to fix: set `wire_api = "responses"` in your provider config.
More info: https://github.com/openai/codex/discussions/7782
in `model_providers.llamacpp.wire_api`

反正我是各种报错,如果有大佬成功了,可以分享给小妹,不胜感激!!!

本地 AI 工具的发展,让更多开发者能低成本尝试 Agent 模式。希望这个分享能给大家提供一些参考,实际操作时请注意数据安全和模型局限性。

科技的乐趣,就是把前沿工具变成每个人都能上手的东西。如果对茶馆的分享感兴趣欢迎点赞、转发、关注,感谢大家!!!

相关推荐
AI小百科10 天前
llama.cpp vs vLLM:深度解析与选型指南
llama·vllm
下班走回家11 天前
本地部署大模型的三种方式:Ollama vs vLLM vs llama.cpp
人工智能·llama·vllm
zhy2956314 天前
【DNN】基于llama.cpp的Qwen3-0.6B量化部署微调
人工智能·lora·dnn·llama·qwen3
kuokay15 天前
MLOps 与 AIOps 的核心概
人工智能·分布式·大模型·agent·llama
Trouville0115 天前
windows系统使用llama.cpp进行本地大模型部署
llama
棒棒的唐15 天前
windows 直接安装llama.cpp的方法
llama
troubles maker16 天前
LLaMA-Adapter V2: Parameter-Efficient Visual Instruction Model
llm·nlp·llama·多模态
xyz_CDragon16 天前
把旧电脑变成AI算力:llama.cpp RPC 局域网分布式推理验证与实战
人工智能·分布式·python·rpc·llama
wengad16 天前
llama.cpp进行模型格式转换和量化
llama