pytorch 基础知识

手撸代码:https://zhuanlan.zhihu.com/p/666471085?utm_id=0

1.1dropout

1.2 pytorch中gather和scatter_区别

1.3 pytorch中torch.Tensor()和torch.tensor()的相同点和区别

1.4 pytorch中train和eval有什么不同

(1). model.train()------训练时候启用

启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为True

(2). model.eval()------验证和测试时候启用

不启用 BatchNormalization 和 Dropout,将BatchNormalization和Dropout置为False

train模式会计算梯度,eval模式不会计算梯度。

1.5 减小模型内存的方法?

模型剪枝、模型蒸馏、模型量化、模型结构优化

相关推荐
余俊晖3 分钟前
多模态视觉语言模型增强原生分辨率继续预训练方法-COMP架构及训练方法
人工智能·语言模型·自然语言处理
运维@小兵15 分钟前
使用Spring-ai实现同步响应和流式响应
java·人工智能·spring-ai·ai流式响应
玩具猴_wjh16 分钟前
线性规划核心知识点
人工智能·机器学习
科学最TOP21 分钟前
IJCAI25|如何平衡文本与时序信息的融合适配?
人工智能·深度学习·神经网络·机器学习·时间序列
黑客思维者27 分钟前
突破 Python 多线程限制:GIL 问题的 4 种实战解法
服务器·数据库·python·gil
maycho12335 分钟前
探索锂电池主动均衡仿真:从开关电容到多种电路的奇妙之旅
人工智能
余俊晖35 分钟前
多模态文档智能解析模型进展-英伟达NVIDIA-Nemotron-Parse-v1.1
人工智能·ocr·多模态
南太湖小蚂蚁40 分钟前
通过TRAE和LLM实现电影数据查询和分析
人工智能
双翌视觉1 小时前
机器视觉赋能平板电脑OCA真空全贴合,精度、效率与智能化的三重飞跃
人工智能·机器学习·电脑
CareyWYR1 小时前
AI 把技术门槛踩碎,我们拿什么作为护城河?
人工智能