pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
听你说329 小时前
丈八科技与浪潮海若达成战略合作:共建人工智能产测一体化超级工厂
人工智能·科技
初心未改HD9 小时前
深度学习之Attention注意力机制详解
人工智能·深度学习
X1A0RAN9 小时前
解决Pycharm中部分文件或文件夹被隐藏不展示问题
ide·python·pycharm
code_pgf9 小时前
模态生成器:原理详解与推荐开源项目
人工智能·深度学习·开源
ws2019079 小时前
AUTO TECH China 2026广州汽车零部件展:从整机集成迈向核心部件的产业跃升
大数据·人工智能·科技·汽车
MomentYY9 小时前
第 3 篇:让 Agent 学会分工,LangGraph 构建多 Agent系统
人工智能·python·agent
程序员Jelena9 小时前
Python 代码是什么?—— 从字节到执行的完整解析
python
初心未改HD9 小时前
深度学习之Transformer架构详解
人工智能·深度学习·transformer
拾年2759 小时前
一个项目教你玩转Claude Code 常用命令
人工智能
阿里云大数据AI技术9 小时前
PAI-FA|突破 TMEM 瓶颈:FlashAttention-4 大 Head Dimension (256) 高性能算子实现与优化
人工智能