技术栈
vllm-ascend
x_lrong
7 天前
微调
·
部署
·
昇腾
·
ascend
·
llamafactory
·
qwen3
·
vllm-ascend
昇腾Ascend环境微调部署Qwen3(LlamaFactory+vLLM-Ascend)
环境介绍:GitCode:实例:NPU basic · 1 * NPU 910B · 16v CPU · 64GB
AiChiMomo.
4 个月前
昇腾
·
vllm
·
glm4.5
·
vllm-ascend
【vLLM-模型特性适配】GLM4.5 GLM4.6 w8a8权重量化
作者:昇腾实战派智谱GLM4.5、GLM4.6模型推理性能优化,本文提供量化权重导出方法,使用工具是msmodelslim。
我是有底线的