技术栈

vol.3.4

计算机魔术师
13 小时前
人工智能·后端·面试·架构·moe·vol.3.3·vol.3.4
【AI面试八股文 Vol.3.4:训练微调部署选型】从预训练到量化部署:LLM 工程落地如何做模型选择摘要:用一条工程主线讲清 LLM 从预训练、SFT、RLHF/DPO/KTO 对齐,到 LoRA/Adapter/P-tuning/IA3 微调、INT8/INT4/GPTQ/AWQ 量化部署和 Llama/Qwen/DeepSeek 等模型选型的取舍逻辑,重点回答面试里最容易被追问的成本、显存、效果和项目落点。
我是有底线的