技术栈

densemlp

nju_spy
6 小时前
人工智能·lora·大模型·混合精度·混合专家模型 moe·densemlp·门控机制
南京大学LLM开发基础(四)MoE, LoRA, 数的精度 + MLP层实验https://njudeepengine.github.io/llm-course-lecture/2025/lecture8.html#1
我是有底线的