pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
victory0431几秒前
DeepSeek-R1 86页加长版:通过强化学习激励大语言模型的推理能力 技术报告中文翻译
人工智能
郑寿昌1 分钟前
2026传感器革命:智能感知新纪元
人工智能
杰之行2 分钟前
Fast-DDS Transport 层架构详解
c++·人工智能
陈天伟教授2 分钟前
图解人工智能(19)机器学习基本流程
人工智能
lusasky3 分钟前
GPU芯片那些事
人工智能
码农阿强6 分钟前
技术解析|doubao‑seedance 全系列模型深度解读:API 开放生态赋能 AI 视频生成工程化
人工智能·音视频
大拿爱科技7 分钟前
声音克隆接入短视频流程时,哪些环节最容易出问题?
人工智能·aigc·音视频·语音识别
人月神话-Lee7 分钟前
【图像处理】二值化与阈值——从灰度到黑白的决策
图像处理·人工智能·计算机视觉
瑞华丽PLM8 分钟前
瑞华丽工业软件研发效能全景展示
人工智能·算法·cae·工业软件·国产软件·瑞华丽plm·瑞华丽
m0_6346667311 分钟前
Zero 和 Spec Kit:AI Agent 正在把“编程”推向更显式的契约时代
人工智能·ai