技术栈
旅程式学习
镰刀韭菜
5 小时前
大语言模型
·
强化学习
·
知识蒸馏
·
指令微调
·
deepseek
·
推理模型
·
旅程式学习
【LLM】一文理解推理大模型
2024年,大语言模型领域呈现出日益细化的趋势。除了预训练和微调之外,我们还见证了各种专业化应用的兴起,从检索增强生成到代码助手,不一而足。我预计这一趋势将在2025年进一步加速,对特定领域和应用场景的优化(即“专业化”)将得到更加重视。 图1:阶段1至阶段3是开发大型语言模型的通用步骤。阶段4则针对特定用例对大型语言模型进行专门化处理。
我是有底线的