pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
才兄说8 小时前
机器人二次开发机器狗巡检?低耗电自主绕行
python
闵孚龙8 小时前
Claude Code Plan Mode 计划模式全解析:先规划后执行、审批流、计划文件、Auto Mode、多 Agent 协同
大数据·人工智能
happyprince8 小时前
01-FlagEmbedding 项目概述
人工智能
迪娜学姐8 小时前
调用GPT image 2一键批量美化项目申请答辩PPT
人工智能·gpt·chatgpt·powerpoint·ppt
happyprince8 小时前
02-FlagEmbedding 抽象基层 (ABC Layer) 深度分析
人工智能
Raink老师8 小时前
【AI面试临阵磨枪-54】如何监控 AI 系统:成功率、延迟、Token 消耗、幻觉率、调用量
人工智能·面试·职场和发展
财迅通Ai8 小时前
利欧股份科技股权投资成效显著 构建硬科技布局新生态
大数据·人工智能·科技·利欧股份
-SOLO-8 小时前
Python 爬取小红书 文章标题和内容 仅供学习
android·python·学习
舞影天上9 小时前
WSL 里跑 Node.js 服务:nohup 对它无效,我翻了 5 次车才摸清
人工智能
雷欧力9 小时前
Claude Code 两个被低估的新命令:/goal 让它自己干到底,Agent View 让你同时盯十个任务
人工智能