hugging-face - hugging-face技术,学习,经验文章

俊俊谢

20 天前

LLaMA-Factory 部署与 DeepSeek-R1-Distill-Qwen 模型乱码问题解决全记录摘要：本文记录了在远程 A100 服务器上部署 LLaMA-Factory，并加载 DeepSeek-R1-Distill-Qwen 系列模型时遇到的输出乱码问题。通过强制指定 Qwen2Tokenizer，最终完美解决。全过程包括环境配置、CUDA 版本协调、模型下载、问题排查与修复。