Accelerated PyTorch training on Mac

本文翻译整理自:Accelerated PyTorch training on Mac
https://developer.apple.com/metal/pytorch/


文章目录


Metal 加速

PyTorch使用新的 Metal Performance Shaders(MPS)后端进行GPU训练加速。

这个MPS后端扩展了PyTorch框架,提供了在Mac上设置和运行操作的脚本和功能。

MPS框架使用针对每个Metal GPU系列的独特特性进行微调的内核来优化计算性能。

新的mps设备将机器学习计算图和原语映射到MPS Graph框架和MPS提供的调优内核上。


要求

  • 配备Apple芯片或AMD GPU的Mac电脑
  • macOS 12.3或更高版本
  • Python 3.7或更高版本
  • Xcode命令行工具:xcode-select --install

开始

您可以使用Anaconda或pip。请注意,带有Apple芯片的Mac和带有Intel x86的Mac之间的环境设置会有所不同。

使用安装页面上的PyTorch安装选择器为MPS设备加速选择预览(夜间)。MPS后端支持是PyTorch 1.12官方版本的一部分。PyTorch的预览(夜间)版本将在您的设备上提供最新的mps支持。


1.Set up


Anaconda

Apple silicon

shell 复制代码
curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh
sh Miniconda3-latest-MacOSX-arm64.sh

x86

shell 复制代码
curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.sh
sh Miniconda3-latest-MacOSX-x86_64.sh

pip

您可以使用macOS附带的预装pip3。或者,您可以从Python网站或Homebrew包管理器安装它。


2.安装


Anaconda
shell 复制代码
conda install pytorch torchvision torchaudio -c pytorch-nightly

pip
shell 复制代码
pip3 install --pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu

从源代码构建

构建支持MPS的PyTorch需要Xcode13.3.1或更高版本,您可以在Mac App Store上下载最新的公开Xcode版本或在Mac App Store上下载最新的beta版本或在Apple Developer网站上下载最新的beta版本。
USE_MPS环境变量控制构建PyTorch并包含MPS支持。

要构建PyTorch,请按照PyTorch网站上提供的说明进行操作。


3.验证

您可以使用简单的Python脚本验证mps支持:

python 复制代码
import torch
if torch.backends.mps.is_available():
    mps_device = torch.device("mps")
    x = torch.ones(1, device=mps_device)
    print (x)
else:
    print ("MPS device not found.")

输出应显示:

shell 复制代码
tensor([1.], device='mps:0')

反馈意见

MPS后端处于测试阶段,我们正在积极解决问题并修复错误。要报告问题,请使用标签为"模块:MP"的GitHub问题跟踪器


资源

PyTorch安装页面
PyTorch留档在MPS后端
添加一个新的PyTorch操作到MPS后端
PyTorch性能分析使用MPS分析器

相关推荐
Neozsvc3 分钟前
飞书工单审批对接腾讯电子签:开启合同流程自动化新时代
运维·人工智能·后端·自动化·飞书
Luckysec20 分钟前
微信小程序源码逆向 MacOS
macos·微信小程序·小程序·渗透测试·wxappunpacker
Mamong24 分钟前
Metal 学习笔记五:3D变换
ios·swift·metal
吃汤圆的抹香鲸29 分钟前
PhpStorm 绿色版 安装包 Win/Mac/Linux 商业的PHP集成开发环境 2025全栈开发终极指南:从零配置到企业级实战
linux·ide·windows·macos·php·intellij-idea·phpstorm
冀辉29 分钟前
Ubuntu2204下使用NVIDIA GeForce RTX 4090进行DeepSeek-R1-Distill-Llama-8B模型微调
人工智能·sft·大模型微调·unsloth·deepseek蒸馏模型微调
阿里云大数据AI技术30 分钟前
Milvus x DeepSeek 搭建低成本高精度 RAG 实战
人工智能·milvus·rag·pai·deepseek
吃汤圆的抹香鲸40 分钟前
PR 安装包 2018-2024(Win,Mac)文中为使用技巧和教程
windows·macos
csdn5659738502 小时前
AI 时代下,操作系统如何进化与重构?
人工智能·重构·操作系统
小锋学长生活大爆炸2 小时前
【知识】torchrun 与 torch.multiprocessing.spawn 的对比
人工智能·pytorch
人肉推土机2 小时前
大模型最新面试题系列:深度学习基础(一)
人工智能·pytorch·语言模型·面试·ai编程