pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
Mr.朱鹏2 分钟前
科技资讯日报 · 2026-06-08
人工智能·科技·chatgpt
ai产品老杨2 分钟前
【架构深评】打破多品牌壁垒:如何基于 GB28181 与 RTSP 栈,构建高解耦的 AI 视频流媒体管理平台?(附源码交付)
人工智能·架构·媒体
小丶舟4 分钟前
6GB显卡本地AI效率提升实战:Ollama服务化+API调用+成本对比
人工智能
小龙报6 分钟前
【AI全栈开发】一文打通AI时代的前后端开发核心概念
人工智能
AI探索先锋8 分钟前
[特殊字符] Siri AI 炸场 WWDC!苹果联手谷歌 Gemini 打造“真·AI助手“,13人公司掀翻Transformer|AI科技热线
人工智能·transformer·wwdc
jinxindeep10 分钟前
超越VLA与世界模型:构建下一代物理智能系统的四大支柱
人工智能
站大爷IP12 分钟前
那天,我的Python函数死活改不了全局变量
python
L_Jason先生13 分钟前
给 AI 一张地图,而不是一本手册——AGENTS.md 内容策略完全指南
人工智能
右耳朵猫AI13 分钟前
Python周刊2026W22 | Django 6.1 Alpha 1发布、Nuitka 4.1发布、PEP 831终稿、PEP 808已接受
开发语言·python·django
珠***格15 分钟前
Ⅱ型边缘网关|易部署、易扩容、易改造
大数据·人工智能·分布式·能源·边缘计算