day39

@浙大疏锦行

  1. CPU 与 GPU 性能对比

CPU:核心少,线程多,适合复杂逻辑、分支判断,以及少量数据的计算。

GPU:核心极多,线程多,适合大规模并行计算(如图像处理、深度学习矩阵运算)。

关键指标:

CPU:核心数、线程数、主频、缓存。

GPU:CUDA 核心数、显存大小、显存带宽、算力

2.GPU 训练的方法

PyTorch 中 GPU 训练的核心是将 "模型" 和 "数据" 都移动到 GPU 设备上,步骤如下:

(1)确定可用 GPU 设备:

(2)模型移动到 GPU:

(3)数据(张量 / 数据集)移动到 GPU:

3.类的 call 方法

在 Python 中,call 让类实例可以像函数一样被调用。

在 PyTorch 中,nn.Module 实现了 call,调用时会自动执行 forward() 方法,并做额外的 hook、参数管理等。

所以可以写:

4.对比不同loss记录频率对训练耗时的影响

相关推荐
开源技术5 分钟前
Python GeoPandas基础知识:地图、投影和空间连接
开发语言·ide·python
hedley(●'◡'●)8 分钟前
基于cesium和vue的大疆司空模仿程序
前端·javascript·vue.js·python·typescript·无人机
Cult Of8 分钟前
Alicea Wind的个人网站开发日志(2)
开发语言·python·vue
啊阿狸不会拉杆14 分钟前
《机器学习导论》第 5 章-多元方法
人工智能·python·算法·机器学习·numpy·matplotlib·多元方法
wangsir.31 分钟前
测试之自动化测试常用函数
python·测试
铁蛋AI编程实战35 分钟前
MemoryLake 实战:构建超长对话 AI 助手的完整代码教程
人工智能·python·microsoft·机器学习
清水白石00839 分钟前
《为什么说 deque 是 Python 滑动窗口的“隐藏神器”?深入解析双端队列的高效之道》
开发语言·python
kjkdd42 分钟前
5. LangChain设计理念和发展历程
python·语言模型·langchain·ai编程
摘星编程1 小时前
CANN ops-nn 激活函数算子全解析:从ReLU到GELU的演进与实现
python
love530love1 小时前
【高阶编译】Windows 环境下强制编译 Flash Attention:绕过 CUDA 版本不匹配高阶指南
人工智能·windows·python·flash_attn·flash-attn·flash-attention·定制编译