大模型面试题：大模型的训练和推理中显存和计算量的情况

算法狗22026-02-07 9:17

我整理好的1000+面试题，请看
大模型面试题总结-CSDN博客

或者

https://gitee.com/lilitom/ai_interview_questions/blob/master/README.md

最好将URL复制到浏览器中打开，不然可能无法直接打开

好了，我们今天针对上面的问题，

大模型的训练和推理中显存和计算量的情况？

先说结论：

参数量

，令该值为
训练计算量

，只是前向的，后向是2倍
训练显存量

(假设以2-bype来表示中间激活)，这个算出来的结果就是bytes，不是数值的个数，其中包括了模型参数、梯度和优化器状态,34bsh是中间激活
推理显存量

(假设是2-byte)，其中的表示模型显存。

上一篇：深入CANN ops-nn：揭秘AIGC高性能算子开发实战

下一篇：采用 TitanIDE 3.0 开展团队级 AI-Coding 优势分析

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 06Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 07OpenClaw + 飞书（Feishu）环境搭建指南 08Window 10部署openclaw报错node.exe : npm error code 128 09AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot 10本地部署 OpenClaw + DeepSeek-R1 完全指南