openclaw vllm 20260312

赠送14M的token用完了,打算vllm部署Qwen来跑一跑openclaw

1,起vllm服务

vllm doc

sh 复制代码
CUDA_VISIBLE_DEVICES=0,1 python -m vllm.entrypoints.openai.api_server \
	--model Qwen3-32B \
	--served-model-name qwen3-32b \
	--tensor-parallel-size 2 \
	--enable-auto-tool-choice \
    --tool-call-parser hermes \
	--port 50072

2,openclaw配置vllm的provider

openclaw onboard配置一下provider,url:http://ip:50072/v1, 模型名qwen3-32b,apiKey随便填一个

就能调自己的vllm服务了,可以随便测,不用担心tokens;

问题

  1. 如何停止vllm服务,换个模型重启?不能直接kill,如下重启:

    sh 复制代码
    pkill -15 -f vllm.entrypoints.openai.api_server
    # 等gpu显存退了
    pkill -9 -f vllm
  2. tool parser,vllm起服务名字中,需要加上tool相关参数,因为这边基本是要tool能力的。

  3. max_model_len参数不需要设置,因为默认用模型config.json中max_position_embeddings,超过它的话又会报错。

  4. qwen3-32b,长度太短,40960,聊一轮就报长度超了,没法用在openclaw中。

  5. qwen3-vl-32b-instruct的max_position_embeddings=26w,够用了;但是效果不行,一直在读文件,停不下来;虽然qwen3-vl用了图片视频以及长文本,但真正的长文本能力应该比较弱;

  6. 另外,在docker中装的openclaw,在docker里面,只能前台运行"openclaw gateway"。

  7. qwen3-vl-32b-thinking,思考太长了,费token费时间,再测测。

相关推荐
祥哥的说3 小时前
万字深度解析 OpenClaw 架构:为什么它能成为全球最火的开源 AI Agent?
人工智能·架构·开源·openclaw
跨境Tool哥3 小时前
2026网赚升级版:利用 OpenClaw 搭建属于你的 AI Agent 赚钱机器
人工智能·openclaw
小阿鑫3 小时前
深度测评:在微信里直接操控 OpenClaw
ai·微信·openclaw
悟纤3 小时前
OpenClaw 入门教程 | OpenClaw教程 | 第1篇
人工智能·ai agent·openclaw
低调小一3 小时前
OpenClaw 从安装到可用:把 Tools/Skills 变成“可控操控面板”,并用飞书做远程入口
java·大数据·人工智能·飞书·openclaw·clawbot·skil
OpenAnolis小助手4 小时前
智算新范式:基于 Anolis OS 构建 Confidential AI Agent — OpenClaw-CC 隐私保护实践
人工智能·anolis os·智算·openclaw·confidential ai
主机哥哥4 小时前
养龙虾迅速走红!OpenClaw部署保姆级教程,两步解锁专属龙虾AI助理!
人工智能·openclaw·openclaw部署
skywalk81634 小时前
在AIStudio星河社区配置OpenClaw小龙虾
人工智能·openclaw
zhu62019766 小时前
【保姆级】3分钟搞定 OpenClaw 大龙虾环境:Docker 一键部署,零基础!
运维·docker·容器·openclaw