Pytorch ddp切换forward函数 验证ddp是否生效

DDP及其在pytorch中应用

ddp默认调用forward函数,有些模型无法使用forward函数,可以对模型包装一下。

python 复制代码
class modelWraper(nn.Module):
    def __init__(self, model):
        super().__init__()
        self.model = model

    def forward(self, *args, **kwargs):
        return self.model.rlhf(*args, **kwargs)

有时ddp跑起来,不确定是否生效,loss backward后不同rank进程的梯度应该一样的,可以通过print 梯度确认。

python 复制代码
loss.backward()
grad_flag = raw_model.lm_head.weight.grad[0,:3]
print(f"grad {ddp_rank} {grad_flag}")


grad 1 tensor([2.9296e-04, 6.2223e-05, 1.0089e-03], device='cuda:1')
grad 0 tensor([2.9296e-04, 6.2223e-05, 1.0089e-03], device='cuda:0')

pytorch分布式系列2------DistributedDataParallel是如何做同步的?

相关推荐
Deepoch19 小时前
Deepoc具身模型:智能炒菜机器人的技术底座
人工智能·科技·机器人·具身模型·deepoc·炒菜机器人·厨师
狐5719 小时前
2026-01-19-论文阅读-SAM2-2
论文阅读·人工智能·计算机视觉
liu_sir_19 小时前
android9.0 amlogic 遥控器POWER按键的假待机的实现
开发语言·git·python
Data-Miner19 小时前
Excel-Agent永久买断,一款结合AI Agent的excel数据处理智能体
人工智能·excel
北京耐用通信19 小时前
耐达讯自动化Profibus总线光纤中继器在连接测距仪中的应用
人工智能·物联网·网络协议·网络安全·自动化·信息与通信
MoonBit月兔19 小时前
MoonBit 获日本最大技术社区Zenn原生支持,热度持续上升中!
人工智能·ai编程·moonbit
高频交易dragon19 小时前
配对交易策略大观
大数据·人工智能
我叫张土豆19 小时前
2026最强实战:用《三国演义》把 KAG(知识增强生成)跑通:LLM抽取知识图谱→Neo4j入库→召回评测→图谱问答闭环(附完整测试代码)
人工智能·知识图谱·neo4j
Roye_ack19 小时前
【Mac 实战】简单知识图谱搭建步骤详解(Neo4j + py2neo)
人工智能·知识图谱·neo4j·py2neo
Niuguangshuo19 小时前
CLIP:连接图像与文本的 AI 核心工具
人工智能·神经网络·算法