技术栈
hugging-face
俊俊谢
3 小时前
机器学习
·
大模型
·
llama
·
qwen
·
llama-factory
·
deepseek
·
hugging-face
LLaMA-Factory 部署与 DeepSeek-R1-Distill-Qwen 模型乱码问题解决全记录
摘要:本文记录了在远程 A100 服务器上部署 LLaMA-Factory,并加载 DeepSeek-R1-Distill-Qwen 系列模型时遇到的输出乱码问题。通过强制指定 Qwen2Tokenizer,最终完美解决。全过程包括环境配置、CUDA 版本协调、模型下载、问题排查与修复。
我是有底线的