pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
Java后端的Ai之路几秒前
以为AI开发就是调接口?一场25K的面试让我看到真相,原来真正的技术深度在这!
人工智能·面试·职场和发展·agent·ai应用开发
水木流年追梦几秒前
【python因果库实战27】逆概率加权模型2
开发语言·python
塔能物联运维3 分钟前
两相液冷:从“散热”到“控温”,重构高密度算力的热管理系统
大数据·人工智能
lazy熊3 分钟前
AI 编程新手教程(1):用 Codex 读懂一个现成项目
人工智能
逆羽飘扬4 分钟前
【AI Infra面试】基础学习汇总篇
人工智能·学习
阿里云大数据AI技术12 分钟前
免部署、零运维:阿里云 Milvus Embedding 服务让向量化开箱即用
人工智能
舒一笑13 分钟前
从落地到赋能 | TorchV 如何帮助企业实现真正的 AI 生产力?
人工智能
Awu122720 分钟前
⚡精通Claude第7课-Plugins实战指南
人工智能·aigc·claude
铁皮哥22 分钟前
【后端/Agent 开发】给你的项目配置一套 .claude/ 工作流:别再裸用 Claude Code 了!
java·windows·python·spring·github·maven·生活
imbackneverdie22 分钟前
只用一天,能写完一篇文献综述吗?
人工智能·信息可视化·aigc·文献综述·文献检索·ai工具·科研工具