pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
天天进步20155 小时前
Python全栈项目--基于机器学习的异常检测系统
开发语言·python·机器学习
Ztopcloud极拓云视角6 小时前
ChatGPT超级应用改版技术解析:Codex集成架构与多模型路由实战
人工智能·chatgpt·架构
努力学习_小白6 小时前
基于 RNN 的心脏病预测
pytorch·rnn·深度学习
xxie12379412 小时前
return与print
开发语言·python
秋912 小时前
从 Python 后端工程师转型 AI Engineer(AI 工程化)的完整补课清单(2026实战版)
开发语言·人工智能·python
啦啦啦_999912 小时前
5. 迁移学习
人工智能·机器学习·迁移学习
A.说学逗唱的Coke12 小时前
【AI·Coding】TDD × SDD × AI Coding:从“测试驱动“到“规范驱动“的智能协作实践
人工智能·驱动开发·tdd
云烟成雨TD12 小时前
Spring AI Alibaba 1.x 系列【78】沙箱(Sandbox)
java·人工智能·spring
tq108613 小时前
基于SLIP的防幻觉的指南
人工智能
慕木沐13 小时前
Google ADK Java 1.0版本 核心机制与实战 Demo
java·开发语言·python