大模型参数评估 - 大模型参数评估技术,学习,经验文章

minhuan

6 个月前

大模型应用：大模型越大越好？模型参数量与效果的边际效益分析.51我们接触大模型以来，经常听到什么模型有多少亿参数，通常1B/7B/13B/34B/70B/175B或者GPT有 1750 亿参等等这类说法，很容易让我们陷入模型参数量越大，效果越好的误区。但实际应用中，我们在本地化部署大模型时会发现：70B 的超大模型不仅需要天价算力和显存，处理简单的客服对话、文本分类任务时，效果反而和 13B 的模型差不多，这就是“边际效益递减”在起作用。