如何速成LLM以伪装成一个AI研究者(6)——LoRA,Adapter,P-tuning,量化,QLoRA如何速成LLM以伪装成一个AI研究者(1)——循环,卷积,编解码器,注意力,Transformer 如何速成LLM以伪装成一个AI研究者(2)——Pre-LN,KV-Cache优化,MoE 如何速成LLM以伪装成一个AI研究者(3)——预训练,监督微调,强化学习RLHF/DPO 如何速成LLM以伪装成一个AI研究者(4)——PPO,GRPO,DAPO,GSPO 如何速成LLM以伪装成一个AI研究者(5)——显存估算,显卡选择