技术栈

大模型参数评估

minhuan
8 小时前
人工智能·大模型参数评估·边际效益分析·大模型参数选择
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51我们接触大模型以来,经常听到什么模型有多少亿参数,通常1B/7B/13B/34B/70B/175B或者GPT有 1750 亿参等等这类说法,很容易让我们陷入模型参数量越大,效果越好的误区。但实际应用中,我们在本地化部署大模型时会发现:70B 的超大模型不仅需要天价算力和显存,处理简单的客服对话、文本分类任务时,效果反而和 13B 的模型差不多 ,这就是“边际效益递减”在起作用。
我是有底线的