pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
生成论实验室4 分钟前
机器人:一个自主运动的系统
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
Godspeed Zhao7 分钟前
现代智能汽车系统——智驾SoC之框架版图
人工智能·机器学习·自动驾驶·汽车·soc
薛定猫AI9 分钟前
【技术干货】OpenRouter Fusion复合API实战:多模型协同调用如何突破单模型性能瓶颈
人工智能·agi
dayuOK63079 分钟前
写作卡壳怎么办?我的“5分钟启动法”
人工智能·职场和发展·自动化·新媒体运营·媒体
大山佬11 分钟前
边缘 AI 部署实战:从模型量化到 MCU 推理的端到端工程方案
人工智能
XIAOYU67201318 分钟前
不限物化选科的大数据管理与应用靠谱吗
人工智能
初晴融雪-快雪时晴18 分钟前
产业分析:AI产业 上下游 全景分析 202606版本
人工智能·基础知识
秋名山码民19 分钟前
Graph RAG 深度解析:从向量检索到知识推理的技术演进
大数据·人工智能·rag
Data-Miner25 分钟前
大语言模型+智能体AI,122页PPT详解落地应用培训!
人工智能·microsoft·语言模型
AC赳赳老秦29 分钟前
用 OpenClaw 搭建服务器故障应急响应系统,自动处理 80% 常见运维故障
android·运维·服务器·python·rxjava·deepseek·openclaw