动手学深度学习33 单机多卡并行

单机多卡并行

更多的芯片
https://courses.d2l.ai/zh-v2/assets/pdfs/part-2_2.pdf

多GPU训练
https://courses.d2l.ai/zh-v2/assets/pdfs/part-2_3.pdf

当transformer模型很大,有100GB的时候只能用模型并行。

数据并行,拿的参数是完整的?

QA

1 当有一块卡显存更大的时候,可以把数据批量设大一些,单独给大显存的卡数据多一些。

2 梯度累加起来。

3 存储模型,梯度。中间数据量的大小取决于数据批量大小。批量变小,矩阵运算变小,性能会低。

4 模型并行可以做到一定程度的并行,并行程度会低

5 独立显卡会比集成显卡快很多。

6 无人车关心功耗,希望拿到server端的效果但是功耗要低。

相关推荐
水如烟3 分钟前
孤能子视角:“融智学“理论分析,观点碰撞
人工智能
caoxiaoye6 分钟前
Skills:让AI变身你的专属领域专家
人工智能
lisw058 分钟前
AI宠物市场有哪些成功案例?
人工智能·机器人·宠物
山土成旧客8 分钟前
【Python学习打卡-Day33】你好,PyTorch!从“自动挡”到“手动挡”的深度学习之旅
python·深度学习·学习
上海锝秉工控8 分钟前
增量型旋转式编码器:工业智能化的精密“神经元”
人工智能
wa的一声哭了9 分钟前
矩阵分析 方阵幂级数与方阵函数
人工智能·python·线性代数·算法·自然语言处理·矩阵·django
O561 6O623O7 安徽正华露19 分钟前
露,AI人工智能Morris水迷宫 AI人工智能Morris水迷宫视频分析系统 小鼠恒温游泳池 可折叠水迷宫
人工智能
AC赳赳老秦25 分钟前
工业互联网赋能智造:DeepSeek解析产线传感器数据驱动质量管控新范式
前端·数据库·人工智能·zookeeper·json·flume·deepseek
lxmyzzs44 分钟前
【端侧AI】基于 openvino + YOLOv11 构建多模态视觉分析终端 | 单目测距 | 单目测速
人工智能·yolo·openvino
后端小张1 小时前
【TextIn大模型加速器 + 火山引擎】TextIn大模型加速器与火山引擎协同构建智能文档处理新范式
人工智能·学习·数据挖掘·langchain·tensorflow·gpt-3·火山引擎