openclaw vllm 20260312

赠送14M的token用完了,打算vllm部署Qwen来跑一跑openclaw

1,起vllm服务

vllm doc

sh 复制代码
CUDA_VISIBLE_DEVICES=0,1 python -m vllm.entrypoints.openai.api_server \
	--model Qwen3-32B \
	--served-model-name qwen3-32b \
	--tensor-parallel-size 2 \
	--enable-auto-tool-choice \
    --tool-call-parser hermes \
	--port 50072

2,openclaw配置vllm的provider

openclaw onboard配置一下provider,url:http://ip:50072/v1, 模型名qwen3-32b,apiKey随便填一个

就能调自己的vllm服务了,可以随便测,不用担心tokens;

问题

  1. 如何停止vllm服务,换个模型重启?不能直接kill,如下重启:

    sh 复制代码
    pkill -15 -f vllm.entrypoints.openai.api_server
    # 等gpu显存退了
    pkill -9 -f vllm
  2. tool parser,vllm起服务名字中,需要加上tool相关参数,因为这边基本是要tool能力的。

  3. max_model_len参数不需要设置,因为默认用模型config.json中max_position_embeddings,超过它的话又会报错。

  4. qwen3-32b,长度太短,40960,聊一轮就报长度超了,没法用在openclaw中。

  5. qwen3-vl-32b-instruct的max_position_embeddings=26w,够用了;但是效果不行,一直在读文件,停不下来;虽然qwen3-vl用了图片视频以及长文本,但真正的长文本能力应该比较弱;

  6. 另外,在docker中装的openclaw,在docker里面,只能前台运行"openclaw gateway"。

  7. qwen3-vl-32b-thinking,思考太长了,费token费时间,再测测。

相关推荐
梦雨羊3 小时前
vllm单推理测试
vllm
无心水14 小时前
【OpenClaw:赚钱】案例19、内容产量5倍、广告收入翻4倍:播客转多平台内容矩阵全自动化实战(OpenAI Whisper + Claude)
java·人工智能·python·ai编程·openclaw·养龙虾·java.time
AC赳赳老秦15 小时前
用 OpenClaw 制定技术学习计划:根据目标岗位自动生成学习路线、推荐学习资源
开发语言·c++·人工智能·python·mysql·php·openclaw
大模型推理18 小时前
《Nano-vLLM 源码解读》第 16 篇 · Linear 投影
vllm
嘉陵妹妹1 天前
VLLM auto DL环境配置
vllm
an86950011 天前
【无标题】
vllm
共享家95272 天前
Skill的概述与使用
人工智能·学习·openclaw
蔡不菜和他的uU们2 天前
vLLM实践之个人AI基建——云端vLLM+SSH Tunnel+本地Cherry Studio
人工智能·ssh·vllm
共享家95272 天前
OpenClaw的通道配置
人工智能·学习·openclaw