qwen-2.5-32b - qwen-2.5-32b技术,学习,经验文章

JadenOliver

3 个月前

基于海光8张Z100L算力服务器，vLLM 部署全量微调过的 qwen2.5-32B大模型。在客户提供的 8 * Z100L 算力服务器上，部署全量微调过的 qwen2.5-32B 大模型。说明：输出结果的第1列（例如： 37:00.0、3a:00.0）是显卡对应的 PCI 设备地址。