技术栈
runpod
海棠AI实验室
5 小时前
部署
·
vllm
·
runpod
RunPod Serverless + vLLM:大语言模型部署与配置指南(实战版)
目标:用 RunPod Serverless 的 vLLM Worker,把 Hugging Face 上的主流开源模型快速“无服务器化”,并通过环境变量做显存/吞吐/兼容性调优,最终对外提供 RunPod 原生 API 与 OpenAI 兼容 API 两套调用方式。(docs.runpod.io)
我是有底线的