Pytorch采坑记录:DDP 损失和精度比 DP 差,多卡GPU比单卡GPU效果差

结论:调大学习率或者调小多卡GPU的batch_size

转换DDP模型后模型的整体学习率和batch_size都要变。

当前配置::1GPU:学习率=0.1,batch_size=64

如果8GPU还按之前1GPU配置:8GPU:学习率=0.1,batch_size=64

那么此时对于8GPU而言,效果几乎等于::1GPU:学习率=0.1,batch_size=64 * 8=512

这种8GPU情况下,batch_size等效变大,效果就差了,参考Goyal et al

解决方法是调大学习率或者调小多卡GPU的batch_size

比如上面调大学习率改为 8GPU:学习率=0.1 * 8=0.8,batch_size=64学习率=0.1 * √8 =√8 ,batch_size=64

或者调小batch_size 8GPU:学习率=0.1,batch_size=8

参考:

  1. https://github.com/Lightning-AI/pytorch-lightning/discussions/3706
  2. https://arxiv.org/pdf/1706.02677.pdf
相关推荐
JovaZou36 分钟前
[Python学习日记-75] 计算机基础与网络
开发语言·网络·python·网络协议·学习·tcp/ip·计算机网络
深栈37 分钟前
Tkinter组件-Button按键
python·gui·tkinter
QQ27437851091 小时前
django在线考试系统
后端·python·django
TaoSense1 小时前
未来量子计算技术会如何影响音频DSP的发展?
人工智能·音频·量子计算
AI2AGI2 小时前
天天 AI-250110:今日热点-字节豆包Web端反超百度文心一言,DeepSeek也发力了|量子位智库月报
大数据·人工智能·百度·ai·aigc·文心一言
Loving_enjoy2 小时前
解锁人工智能的核心:人工神经网络全面解析
人工智能·神经网络
程序员非鱼3 小时前
深度学习中常见的激活函数详解
人工智能·python·深度学习·神经网络·机器学习·激活函数
Ckyeka3 小时前
Leetcode刷题笔记—栈与队列
数据结构·python·算法·leetcode
Q_27437851094 小时前
django基于 Python 的考研学习系统的设计与实现
java·python·考研·django
白雪公主的后妈4 小时前
Python爬虫基础——IP反爬虫的应对
爬虫·python·random·requests模块·parsel