Codex+本地Qwen3.5无审查实用案例分享及llama对接踩坑。

大家好,这里是硅谷茶馆。今天和大家分享一个让本地大模型真正帮上忙的实用方案------用 Ollama 结合 OpenAI 的 Codex 工具,在自己电脑上运行 AI 编程助手。

前段时间我们刚分享完Qwen35B的开源无审查模型,今天就把我实践结果分享给大家。过去,AI 辅助编程大多依赖云端服务,长时间使用容易产生费用。本地化方案可以减少对网络和费用的依赖,让开发者在断网环境下也能完成一些代码相关任务。下面我们聊聊实际可行的部署方式。

一、AI Agent 与普通聊天机器人的区别

Agent场景操作:

二、基础部署步骤

以下是简单上手流程,适合有一定命令行基础的朋友操作。

第一步:安装 Codex 客户端前往 OpenAI 开发者官网下载对应系统的 Codex App(支持 Mac 和 Windows)。 安装后先不要用云端账号登录,直接跳过或关闭登录,保持本地模式。

第二步:更新 Ollama确保 Ollama 版本在 0.24 或以上。 在终端输入 ollama -v 检查版本,如果过旧,请到 Ollama 官网下载最新安装包覆盖安装。因为ollama很大,可以使用指定目录安装。下载好本地版本,用下面命令安装

powershell 复制代码
#指定程序安装目录
.\OllamaSetup.exe /DIR="F:\Ollama"
#再添加模型路径环境变量(同上OLLAMA_MODELS)

第三步:下载合适模型推荐根据显存选择模型,例如 Qwen 系列或 Gemma 系列。

常用命令示例(Windows/Linux):ollama run qwen3:27b或更轻量的版本。

Mac 用户可选择 MLX 优化版本以提升速度。

第四步:启动本地对接执行以下命令(以 qwen3.6模型为例):

ollama launch codex-app --model qwen3.6

终端提示重启 Codex 时选择确认。重启后,界面会显示已连接本地模型。

三、实际案例应用分享

测试1:修复BUG(幽灵会穿墙、卡墙、不会追击小黄)

修复后:幽灵会不会卡墙了,也知道追踪小黄

修复后,真的可以玩了:

测试2:开发一个新游戏

游戏展示:

游戏整体还可以,而且我只是给了一句话的prompt,它完成的很好,火力、等级、飞机样式、攻击、还有敌人的血条,完成的还是可以

四、踩坑

看了很多分享说使用llama直连或者直接代理走codex本地推理,完全不可行(个人实验多次),各种报错如下:

1、写法错误

css 复制代码
failed to resolve feature override precedence: legacy `profile = "llamacpp-codex"` config is no longer supported; use `--profile llamacpp-codex` with `llamacpp-codex.config.toml` instead

2、接口不被支持

sql 复制代码
Unable to generate parser for this template. Automatic parser generation failed: ------------ While executing CallExpression at line 85, column 32 in source: ...first %}↵ {{- raise_exception('System message must be at the beginnin... ^ Error: Jinja Exception: System message must be at the beginning.

3、jinjia模版异常

nginx 复制代码
invalid configuration: `wire_api = "chat"` is no longer supported.
How to fix: set `wire_api = "responses"` in your provider config.
More info: https://github.com/openai/codex/discussions/7782
in `model_providers.llamacpp.wire_api`

反正我是各种报错,如果有大佬成功了,可以分享给小妹,不胜感激!!!

本地 AI 工具的发展,让更多开发者能低成本尝试 Agent 模式。希望这个分享能给大家提供一些参考,实际操作时请注意数据安全和模型局限性。

科技的乐趣,就是把前沿工具变成每个人都能上手的东西。如果对茶馆的分享感兴趣欢迎点赞、转发、关注,感谢大家!!!

相关推荐
Soari4 小时前
GitHub 开源项目解析:rk‑llama.cpp —— 基于 llama.cpp 的 Rockchip NPU 加速本地推理引擎
开源·github·llama·llm 推理·npu 本地模型推理·加速 c/c++ 开源项目
王天天(Bennet)11 小时前
【从第一性原理来深入理解Transformer-更适合入门的理解(llama-3B模型为例)】
深度学习·transformer·llama
zhiSiBuYu05172 天前
llama.cpp 本地大模型部署与调用实战
llama
wangqiaowq2 天前
基于 LLaMA-Factory 的完整微调流程
llama
碳基硅坊3 天前
llama.cpp本地部署Qwen3.6-27B
人工智能·llama·推理加速·qwen3.6-27b
sleven fung4 天前
llama-cpp-python 本地部署入门
开发语言·python·算法·llama
碳基硅坊5 天前
Qwen3.6-27B 本地部署三大工具:Ollama、LM Studio、llama.cpp 谁更快?
人工智能·llama·大模型部署
小何code6 天前
人工智能【第53篇】大模型微调实战:LoRA与QLoRA技术详解
lora·llama·peft·qlora·大模型微调
kuokay6 天前
深入理解 LLM 分布式训练全栈:从硬件到 LLaMA-Factory
分布式·llama·deepspeed·fsdp·llama-factory·accelerate