动手学深度学习d2l包M4芯片 gpu加速

conda创建环境

bash 复制代码
CONDA_SUBDIR=osx-arm64 conda create -n ml python=3.9 -c conda-forge
conda env config vars set CONDA_SUBDIR=osx-arm64
conda activate ml

pip安装包

bash 复制代码
pip install --pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu
pip install transformers datasets
pip install matplotlib

下载del源文件

del链接

放到本地项目内

修改del下的torch.py的两个函数内容

python 复制代码
# 修改try gpu函数
def try_gpu(i=0):
    """Return gpu(i) if exists, otherwise return cpu().

    Defined in :numref:`sec_use_gpu`"""
    if torch.cuda.device_count() >= i + 1:
        return torch.device(f'cuda:{i}')
    try:
        return torch.device('mps')
    except:
        return torch.device('cpu')

# 修改try gpu函数
def try_all_gpus():
    """Return all available GPUs, or [cpu(),] if no GPU exists.

    Defined in :numref:`sec_use_gpu`"""
    devices = [torch.device(f'cuda:{i}')
               for i in range(torch.cuda.device_count())]
    try:
        device_macos = torch.device('mps')
    except:
        device_macos = torch.device('cpu')
    return devices if devices else [device_macos]

测试

运行lenet.ipynb测试效果

速度还可以。

还不懂的可以看M1版本的教程

相关推荐
reesn13 小时前
FP8模型反量化讲解
人工智能·python·深度学习
deep_drink13 小时前
【论文精读(二十二)】PointMeta:点云江湖的“兵器谱”,用元架构终结算子内卷(CVPR 2023)
深度学习·神经网络·计算机视觉·3d·point cloud
ekkoalex13 小时前
Qwen,DeepSeek,Hunyuan等多种大模型的技术解读
深度学习·transformer
桂花饼13 小时前
【重磅更新】小镜AI开放平台:Gemini 3 Pro + Sora高清长视频 + ClaudeCode特惠上线
人工智能·aigc·api 调用·gemini 3 pro·gpt-5.2·ai绘画4k
码农丁丁13 小时前
从确定性到概率性:AI时代的技术决策新范式
人工智能·技术管理
Hubianji_0913 小时前
IEEE 智能电网技术与能源工程国际学术会议
人工智能·能源·国际会议
落798.13 小时前
打造智能健康助手:用 ModelEngine 实现实时医学问答
人工智能·modelengine
Mr数据杨13 小时前
我把经验写成工作流,将输出做成可复用的系统
大数据·网络·人工智能
亚里随笔13 小时前
STAgent:专为时空推理设计的智能代理模型
人工智能·深度学习·机器学习·llm·rl·agentic
珠海西格电力13 小时前
零碳园区如何优化能源结构?
运维·人工智能·物联网·架构·能源