动手学深度学习33 单机多卡并行

陌上阳光2024-06-15 2:38

单机多卡并行

更多的芯片
https://courses.d2l.ai/zh-v2/assets/pdfs/part-2_2.pdf

多GPU训练
https://courses.d2l.ai/zh-v2/assets/pdfs/part-2_3.pdf

当transformer模型很大，有100GB的时候只能用模型并行。

数据并行，拿的参数是完整的？

QA

1 当有一块卡显存更大的时候，可以把数据批量设大一些，单独给大显存的卡数据多一些。

2 梯度累加起来。

3 存储模型，梯度。中间数据量的大小取决于数据批量大小。批量变小，矩阵运算变小，性能会低。

4 模型并行可以做到一定程度的并行，并行程度会低

5 独立显卡会比集成显卡快很多。

6 无人车关心功耗，希望拿到server端的效果但是功耗要低。

上一篇：SQL Auto Increment

下一篇：K8s 集群高可用master节点ETCD全部挂掉如何恢复?

热门推荐

01GitHub 镜像站点 02UV安装并设置国内源 03BongoCat - 跨平台键盘猫动画工具 04安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）05Linux下V2Ray安装配置指南 06本地部署阿里最新开源的Z-Image 07【保姆级教程】免费使用Gemini3的5种方法！免翻墙/国内直连 0846个Nano-banana 精选提示词，持续更新中 09Meta第三代“分割一切”模型——SAM 3本地部署教程：首支持文本提示分割，400万概念、30毫秒响应，检测分割追踪一网打尽 10Labelme从安装到标注：零基础完整指南