pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
暗夜猎手-大魔王6 分钟前
转载--AgentScope 生产最佳实践
人工智能
garmin Chen10 分钟前
从 Transformer 到 Agent:大模型技术全景解析
java·人工智能·python·深度学习·transformer
愚公移码15 分钟前
蓝凌EKP18产品:流程引擎技术篇之流程核心概念模型
java·人工智能·流程引擎·蓝凌
没有钱的钱仔16 分钟前
pytorch_cuda安装
人工智能·pytorch·python
大模型最新论文速读17 分钟前
06-11 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
xianghongtao011621 分钟前
在你思考之前:System 0 与“认知殖民”——三种 AI 认知框架之争
人工智能·认知框架·认知殖民
Full Stack Developme23 分钟前
Apache Tika 教程
java·开发语言·python·apache
私人珍藏库26 分钟前
[Android] 视频下载鸟 v20.02 会员
android·人工智能·智能手机·app·工具·多功能
吨吨不打野28 分钟前
梯度变化的数学解释
人工智能
SmartBrain40 分钟前
编程助手工具自动化开发对比报告:OpenSpec、Claude Code、Cursor、PI
大数据·人工智能