pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
myenjoy_1几秒前
采集链路诊断与可观测性——当数据不“对“的时候,你在第几层排查?
python
半亩码田几秒前
小米MiMo Code深度解析:基于OpenCode的长程编程Agent,三项Benchmark超越Claude Code
人工智能·语言模型·ai编程
xianghongtao01161 分钟前
把“AI 依赖”变成一个可计算的量:Offloading Score 论文精读
人工智能·ai
kepppt3 分钟前
LikeShop 开源商城系统新增 AI 协同开发能力
人工智能·开源商城
namexingyun3 分钟前
GPT-5.6 前端生成能力深度解析:kindle/kepler/Levi三版本UI实测与技术推演
java·前端·人工智能·gpt·机器学习·ui
2301_818527785 分钟前
瑜伽服品牌出海——AI助力中国瑜伽服走向世界
人工智能
掘金酱6 分钟前
📱 TRAE SOLO 移动端上线征文——“我的第一次移动端AI办公” 评测 | 获奖名单公示
前端·人工智能·trae
码界索隆6 分钟前
Python转Java系列:语法与类型系统
java·开发语言·python
sou_time6 分钟前
从 0 到 商用:AI Agent x SKILL x MCP 全栈实战教程:L3 商用篇:性能 / 成本 / 可观测性 / 安全 / 部署
人工智能·安全
m0_718677497 分钟前
关于用AI做游戏的分析
人工智能·游戏