pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
雨落Re10 小时前
如何设计一个高质量Skill
人工智能
Token炼金师10 小时前
大模型权重文件全指南:从格式选择到优化实战
人工智能
阿牛哥_GX10 小时前
CDP 浏览器操控原理:让脚本接管你的浏览器
人工智能
ThreeS10 小时前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路
人工智能·python
米小虾11 小时前
Loop Engineering —— 循环的设计与自主执行
人工智能·agent
米小虾12 小时前
Harness Engineering —— 系统的安全护栏
人工智能·agent
火山引擎开发者社区12 小时前
积分当钱花,火山引擎开发者激励计划首月消费双倍回馈
人工智能
金銀銅鐵12 小时前
[Python] 模 n 乘法的逆元计算器
python·数学·游戏
aqi0012 小时前
15天学会AI应用开发(十)把文本嵌入模型换成国产模型
人工智能·python·ai编程