技术栈
vol.3.4
计算机魔术师
13 小时前
人工智能
·
后端
·
面试
·
架构
·
moe
·
vol.3.3
·
vol.3.4
【AI面试八股文 Vol.3.4:训练微调部署选型】从预训练到量化部署:LLM 工程落地如何做模型选择
摘要:用一条工程主线讲清 LLM 从预训练、SFT、RLHF/DPO/KTO 对齐,到 LoRA/Adapter/P-tuning/IA3 微调、INT8/INT4/GPTQ/AWQ 量化部署和 Llama/Qwen/DeepSeek 等模型选型的取舍逻辑,重点回答面试里最容易被追问的成本、显存、效果和项目落点。
我是有底线的