pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
Niuguangshuo3 分钟前
深度学习:激活函数大全
人工智能·深度学习
人机与认知实验室21 分钟前
2028年春晚,会出现机器人主持人吗?
人工智能·机器人
java1234_小锋30 分钟前
嵌入模型与Chroma向量数据库 - Qwen3嵌入模型使用 - AI大模型应用开发必备知识
人工智能·向量数据库·chroma
沪漂阿龙31 分钟前
大模型如何突破上下文窗口?RoPE、ALiBi与长文本扩展全解析
人工智能
witAI35 分钟前
**AI仿真人剧生成软件2025推荐,解锁沉浸式数字内容创作
人工智能·python·量子计算
DoogalStudio37 分钟前
DevMind插件设计方案产品需求文档
人工智能·笔记
硅谷秋水39 分钟前
mimic-video:机器人控制的可泛化视频-动作模型,超越VLA模型
人工智能·机器学习·计算机视觉·机器人·音视频
SeatuneWrite1 小时前
**AI仿真人剧工具2025推荐,解锁沉浸式互动叙事新体验*
人工智能·python
l1t1 小时前
利用网易有道龙虾调用ollama本地模型生成幻灯片内容
人工智能·爬虫
b1ue1ue1ue1 小时前
LLM Note
人工智能