pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
gmaajt几秒前
Golang怎么读取环境变量_Golang如何用os.Getenv获取系统环境变量【基础】
jvm·数据库·python
久绊A1 分钟前
Python环境配置错误导致部署失败案例
python
IT技术范3 分钟前
中国AI企业创新实践观察:联想以全栈能力赋能产业普惠
人工智能
m0_596406378 分钟前
CSS复杂组件如何拆解_使用Sass将组件逻辑细化为小文件
jvm·数据库·python
慧一居士14 分钟前
Ollama 本地部署的模型,多个客户端并发访问请求,会有不响应的情况,解决方案
人工智能
微刻时光16 分钟前
影刀RPA:循环相似元素列表深度解析与实战指南
java·人工智能·python·机器人·自动化·rpa·影刀
司南-704924 分钟前
opencode环境搭 并 配置自定义BASE URL
linux·运维·服务器·人工智能
做个文艺程序员30 分钟前
Claude Code vs ChatGPT Codex 深度对比:2026 年哪款 AI 编程工具更适合你?
人工智能·chatgpt
2301_8166602131 分钟前
golang如何实现SSRF防护策略_golang SSRF防护策略实现方案
jvm·数据库·python
甲维斯32 分钟前
智谱CodingPlan老套餐绝版了,全网token收拢!
人工智能·ai编程