Accelerate笔记：本地SGD

UQI-LIUWJ2024-06-04 17:09

本地 SGD 是一种分布式训练技术，其中梯度不是每一步都同步。
每个进程都会更新自己版本的模型权重，在给定的步数后，通过跨所有进程平均这些权重来同步它们。
- 在底层，本地 SGD 代码禁用了自动梯度同步（但累积仍然如预期工作！）。
- 它每 local_sgd_steps 步（以及在训练循环结束时）平均模型参数。
提高了通信效率，并且特别是在计算机缺乏如 NVLink 等更快的互连时，可以显著加速训练。
- 如有必要，本地 SGD 也可以与梯度累积结合使用
限制：当前的实现只适用于基本的多 GPU（或多 CPU）训练，例如，没有 DeepSpeed 等

上一篇：mac node版本切换 nvm install nvm ls-remote N/A问题

下一篇：前端 CSS 经典：mac docker 效果

热门推荐

01UV安装并设置国内源 02KGG转MP3工具|非KGM文件|解密音频 03【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）04Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 062025最新国内服务器可用docker源仓库地址大全（2025年8月更新）07TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 08NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 09全球最强模型Grok4，国内已可免费使用！（附教程）10TRAE Rules 实践：为项目配置 6A 工作流