【AI学习】LLaMA模型的微调成本有几何?

在前面文章《LLaMA 系列模型的进化(二)》中提到了Stanford Alpaca模型。

Stanford Alpaca 基于LLaMA (7B) 进行微调,通过使用 Self-Instruct 方法借助大语言模型进行自动化的指令生成,Stanford Alpaca 生成了 52K 条指令遵循样例数据(Alpaca-52K)用于训练。

据说,这个训练成本不到600美元。那这个成本是如何计算的呢?
训练成本 :在8个80GB A100 上训练了3个小时,不到100美元;
数据成本 :生成数据使用OpenAl的API,500美元。这里就是通过使用 Self-Instruct 方法,使用了OpenAl的接口的调用成本。

在前面文章《英伟达ChipNeMo,一个领域大模型的训练案例》里,介绍了领域大模型的训练过程。如下图:

对应的训练时长为:

使用 128 个 A100 GPU 进行了训练。ChipNeMo 的领域适配预训练成本(包括基于领域数据的继续预训练和SFT),具体见下表,单位是A100 GPU hours

ChipNeMo 的领域适配预训练成本,对比从头开始预训练基础模型的总成本不到 1.5%。

以LLaMa 7B模型的训练来说,总训练时长=2710,按照前面"在8个80GB A100 上训练了3个小时,不到100美元"的成本折算,成本应该小于11300美金

13B模型,总训练时长=5100,成本应该小于21250美金

70B模型,总训练时长=21340,成本应该小于88920美金

至于数据,ChipNeMo 的领域适配预训练需要24B以上的数据,这个可能与相应的数据积累有很大关系,不好计算了。

相关推荐
Moonquakes5402 分钟前
嵌入式开发基础学习笔记(I2C 通信协议与 ADC 模数转换)
笔记·单片机·学习
好奇龙猫2 分钟前
人工智能学习-AI入试相关题目练习-第十一次
人工智能·学习
凤希AI伴侣2 分钟前
凤希AI伴侣:积分可视化与模块重构完成-2026年1月27日
人工智能·凤希ai伴侣
淮北4943 分钟前
大模型学习(一、Qwen2.5-1.5B本地部署)
学习
Jackyzhe4 分钟前
从零学习Kafka:集群架构和基本概念
学习·架构·kafka
小快说网安5 分钟前
深度解析高防 IP 核心技术:流量清洗机制与线路优化原理
人工智能·网络协议·tcp/ip
喜欢踢足球的老罗5 分钟前
解构ClawdBot:当AI Agent遇上生产级工程化架构
人工智能·架构
风好衣轻6 分钟前
[AI] max_num_seqs 参数详解
人工智能·python·深度学习
CCPC不拿奖不改名12 分钟前
提示词工程(Prompt Engineering)全体系知识手册
大数据·人工智能·python·搜索引擎·prompt
雨中飘荡的记忆21 分钟前
Spring AI + MCP:从入门到实战
java·人工智能·spring