vol.3.4 - vol.3.4技术,学习,经验文章

计算机魔术师

2 个月前

【AI面试八股文 Vol.3.4：训练微调部署选型】从预训练到量化部署：LLM 工程落地如何做模型选择摘要：用一条工程主线讲清 LLM 从预训练、SFT、RLHF/DPO/KTO 对齐，到 LoRA/Adapter/P-tuning/IA3 微调、INT8/INT4/GPTQ/AWQ 量化部署和 Llama/Qwen/DeepSeek 等模型选型的取舍逻辑，重点回答面试里最容易被追问的成本、显存、效果和项目落点。