pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
大模型实验室Lab4AI几秒前
GDPO:多目标强化学习高效优化新路径
人工智能·深度学习·算法·机器学习
小刘的大模型笔记3 分钟前
RAG技术实战
人工智能
会算数的⑨4 分钟前
Spring AI Alibaba 学习(三):Graph Workflow 深度解析(下篇)
java·人工智能·分布式·后端·学习·spring·saa
小圣贤君5 分钟前
从「脑内人设」到「一眼入魂」:51mazi 小说人物图 AI 生成实战
前端·人工智能·文生图·ai写作·通义万相·写作软件·小说人物
有味道的男人5 分钟前
除了Python,还有哪些语言可以调用1688商品详情API?
开发语言·python
power 雀儿13 分钟前
LibTorch张量基础
pytorch·深度学习·机器学习
Go_Zezhou13 分钟前
render网站保存历史记录错误解决
开发语言·git·python·html
雾江流17 分钟前
Copilot 30.0.440127001 | 微软出品的AI助手,可无限生图
人工智能·软件工程·copilot
沛沛老爹19 分钟前
AI助手专业能力评估体系构建:四大维度+工具链实战
人工智能·自动化·prompt·agent·评估模板
阿杰学AI20 分钟前
AI核心知识103——大语言模型之 AI PM(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·产品经理·ai产品经理·ai pm