OpenClaw使用前置准备:Ollama+OpenwebUI本地部署/API调用大模型

一、资源下载

docker拉取显卡驱动、ollama(模型部署)、openwebui(前端对话)镜像

复制代码
# 根据cuda版本修改
docker pull nvidia/cuda:xx.xx.x-cudnn-devel-ubuntu24.04

docker pull ollama/ollama
docker pull openwebui/openwebui

modelscope下载官方gguf格式模型,根据硬件显卡显存大小选择其中一种量化模式的模型即可。

复制代码
# 在安装了modelscope的python虚拟环境(venv)下运行
(venv)modelscope download --model Qwen/Qwen3-8B-GGUF xxx.gguf --local_dir ./dir

二、部署

1.启动ollama容器

在模型下载目录下创建docker-compose.yml文件,将下面启动内容文本编辑保存。

复制代码
services:
  ollama:
    image: ollama/ollama:latest
    container_name: ollama
    restart: unless-stopped
    ports:
      - "11434:11434"
    volumes:
      - ollama_data:/root/.ollama
      - .:/models
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

volumes:
  ollama_data:

CMD进入当前路径的windows命令窗口,输入下面指令启动容器。

复制代码
docker compose up -d

2.导入模型

在模型文件所在目录打开 CMD,执行指令后创建Modelfile文件

复制代码
# 注意把文件名换成你实际下载的 gguf 文件名
echo FROM /models/qwen3-xxx.gguf > Modelfile

导入本地模型指令:

复制代码
docker exec -it ollama ollama create qwen3-8b -f /models/Modelfile

网页输入localhost:11434,即可测试是否模型部署成功

3.启动openwebUI容器

新建一个docker-compose.yml文件,输入以下内容

复制代码
services:
  openwebui:
    image: ghcr.io/open-webui/open-webui:main
    container_name: openwebui
    restart: unless-stopped
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://host.docker.internal:11434
      - ENABLE_RAG_WEB_SEARCH=false
      - ENABLE_SEARCH_QUERY=false
      - RAG_EMBEDDING_ENGINE=ollama
      - RAG_OLLAMA_BASE_URL=http://host.docker.internal:11434
      - ENABLE_OPENAI_API=false
      - OPENAI_API_KEY=none
    volumes:
      - openwebui_data:/app/backend/data

volumes:
  openwebui_data:

指令启动

复制代码
docker compose up -d

三、使用

网页访问http://localhost:3000

注册账户

开始使用

添加新的模型地址(以百炼API为例),新建openai接口

新建对话即可看到可用的外部所有模型

相关推荐
小爷毛毛_卓寿杰1 天前
我把一个 3B 模型塞进了 Xinference,然后它干掉了 DeepSeek V3.2
人工智能·开源·github
秦先生在广东1 天前
Agent 闭环才是真正的护城河:Anthropic “300 个 Agent“ 背后被忽视的秘密
人工智能
Bigfish_coding1 天前
前端转agent-【python】- 14 记忆系统优化:摘要与遗忘
人工智能
Bigfish_coding1 天前
前端转agent-【python】-13 Ollama Python流式输出教程:stream=True 与 async 实践
人工智能
字节跳动数据库1 天前
文章分享——相似函数处理方法
人工智能·后端·程序员
Bigfish_coding1 天前
前端转agent-【python】-12 LangChain 入门实战:RAG + LCEL 链式调用
人工智能
程序员cxuan1 天前
读懂 Claude Code 架构分析系列,第一篇,开始!
人工智能·后端·架构
饼干哥哥1 天前
扣子3.0测评:我让 Codex 和 Claude Code 住同一个桌面,结果它们打架了!
人工智能·开源·代码规范
Token炼金师1 天前
IP-Adapter:解耦交叉注意力如何让扩散模型看见图像
人工智能
Bigfish_coding1 天前
前端转agent-【python】-11 LangGraph 高级特性:时间旅行与人工介入
人工智能