pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
Agent产品评测局几秒前
如何搭建一个药品市场价格监控智能体来实现100%价格一致性? —— 2026全渠道价格均衡化架构实战指南
人工智能·ai·chatgpt·架构
每日综合14 分钟前
多元产业赋能数字未来:大洋集团全面进军教育、游戏与大健康赛道
人工智能·游戏
网瘾新之助15 分钟前
像 Git 一样思考你的 Claude Code 会话
人工智能
科技新芯15 分钟前
当AI信号不再可靠,Bidnex在内的程序化广告平台如何应对
人工智能
米小虾15 分钟前
从"工具"到"同事":AI Agent 自主决策能力的工程化实践
人工智能·agent
qq_4112624217 分钟前
四博 AI 智能音箱 S3 三网上网双屏异显技术方案
人工智能·智能音箱
2501_9219608518 分钟前
协同本体论:元公理体系、普适演化律则与工程范式统一构建
python·重构·numpy·pandas·scipy
qq_4112624219 分钟前
四博皮克斯苹果 AI 台灯 / AI 智能音箱 S3 视觉机械臂方案
人工智能·智能音箱
了不起的云计算V19 分钟前
从DeepSeek V4适配看国产算力的三个拐点
数据库·人工智能
Cosolar20 分钟前
大模型应用开发工程师 · 学习路线(完整技术栈版)
人工智能·面试·架构