动手学深度学习33 单机多卡并行

单机多卡并行

更多的芯片
https://courses.d2l.ai/zh-v2/assets/pdfs/part-2_2.pdf

多GPU训练
https://courses.d2l.ai/zh-v2/assets/pdfs/part-2_3.pdf

当transformer模型很大,有100GB的时候只能用模型并行。

数据并行,拿的参数是完整的?

QA

1 当有一块卡显存更大的时候,可以把数据批量设大一些,单独给大显存的卡数据多一些。

2 梯度累加起来。

3 存储模型,梯度。中间数据量的大小取决于数据批量大小。批量变小,矩阵运算变小,性能会低。

4 模型并行可以做到一定程度的并行,并行程度会低

5 独立显卡会比集成显卡快很多。

6 无人车关心功耗,希望拿到server端的效果但是功耗要低。

相关推荐
~央千澈~4 分钟前
《2026鸿蒙NEXT纯血开发与AI辅助》第三章:DevEco Studio 整体功能使用详解以及各个助手以及核心使用方法-卓伊凡
人工智能·鸿蒙开发·鸿蒙next
Learn Beyond Limits4 分钟前
长短期记忆网络|LSTM(Long Short-Term Memory)
人工智能·rnn·深度学习·神经网络·自然语言处理·nlp·lstm
昨夜见军贴06169 分钟前
AI报告文档审核助力本地化升级:IACheck如何支撑食品加工行业数据安全与质量协同发展
大数据·人工智能
大佐不会说日语~18 分钟前
Spring AI Alibaba 模块化重构:从单体到分层架构实践
人工智能·spring·重构
笨笨饿23 分钟前
26_为什么工程上必须使用拉普拉斯变换
c语言·开发语言·人工智能·嵌入式硬件·机器学习·编辑器·概率论
Rabbit_QL27 分钟前
sklearn Pipeline:特征工程和建模流水线
人工智能·python·sklearn
Yao.Li29 分钟前
PVN3D 原生 / ONNX 混合 / TRT 混合推理速度测试
人工智能·3d·具身智能
财经资讯数据_灵砚智能30 分钟前
全球财经资讯日报(日间)2026年4月2日
大数据·人工智能·python·语言模型·ai编程
程序员鱼皮31 分钟前
鱼皮 AI 导航网站,突然起飞了!
人工智能·ai·程序员·编程·ai编程
雷焰财经40 分钟前
宇信科技2025年报解读:战略转型期的财务兑现与未来挑战
人工智能·科技