pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
weixin_668898642 分钟前
Ascend LlamaFactory微调书生模型
人工智能
全栈技术负责人4 分钟前
AI驱动开发 (AI-DLC) 实战经验分享:重构人机协作的上下文工程
人工智能·重构
Wu_Dylan4 分钟前
智能体系列(二):规划(Planning):从 CoT、ToT 到动态采样与搜索
人工智能·算法
一招定胜负5 分钟前
OpenCV轮廓检测完全指南:从原理到实战
人工智能·opencv·计算机视觉
毕设源码-郭学长7 分钟前
【开题答辩全过程】以 基于python电商商城系统为例,包含答辩的问题和答案
开发语言·python
black0moonlight7 分钟前
win11 isaacsim 5.1.0 和lab配置
python
知乎的哥廷根数学学派11 分钟前
基于多尺度注意力机制融合连续小波变换与原型网络的滚动轴承小样本故障诊断方法(Pytorch)
网络·人工智能·pytorch·python·深度学习·算法·机器学习
网安CILLE12 分钟前
PHP四大输出语句
linux·开发语言·python·web安全·网络安全·系统安全·php
xiatianxy14 分钟前
云酷科技用智能化方案破解行业难题
人工智能·科技·安全·智能安全带
jjjddfvv14 分钟前
超级简单启动llamafactory!
windows·python·深度学习·神经网络·微调·audiolm·llamafactory