技术栈
显存计算
asd8705
7 小时前
大模型
·
显存计算
训练大模型所需要的内存计算
计算训练一个7B参数大模型所需的显存,主要涉及以下几个方面:每个参数通常需要4字节(32位浮点数),因此7B参数的显存需求为: