vllm版本0.9.1
启动大模型没有添加--reasoning-parser qwen3参数
完整启动命令参考:
vllm serve /[大模型路径]/Qwen3-32B \
--served-model-name Qwen3-32B \
--host 0.0.0.0 \
--port 8001 \
--dtype float16 \
--tensor-parallel-size 1 \
--max-model-len 32768 \
--reasoning-parser qwen3 \
--enable-auto-tool-choice \
--tool-call-parser hermes