李沐动手学习深度学习——3.7练习

尝试调整超参数,例如批量大小、迭代周期数和学习率,并查看结果。

  1. num_epochs = 10, batch_size = 256, lr = 0.1情况下

  2. num_epochs = 5, batch_size = 256, lr = 0.1情况下

    可以尝试一下,三种参数变化,会发现lr变小,需要的训练次数num_epochs增加,batch_size变小。

增加迭代周期的数量。为什么测试精度会在一段时间后降低?我们怎么解决这个问题?

因为过拟合问题,模型过于拟合训练集数据了,应对测试集与训练集存在一些不同的数据识别不出来。

  1. 降低num_epochs
  2. 数据增强,对于输入数据加一点噪声
  3. 降低模型复杂度,减少神经元
相关推荐
冬夜戏雪1 小时前
实习面经摘录(九)
学习
arvin_xiaoting1 小时前
OpenClaw学习总结_I_核心架构_8:SessionPruning详解
前端·chrome·学习·系统架构·ai agent·openclaw·sessionpruning
小程故事多_802 小时前
OpenClaw工具引擎架构全解析,AI Agent的“双手”如何落地实操
人工智能·架构·aigc·ai编程·openclaw
qq_452396232 小时前
【AI 架构师】第十篇:Agent 工业化部署 —— 从 FastAPI 到云端全链路监控
网络·人工智能·ai·fastapi
前端摸鱼匠2 小时前
【AI大模型春招面试题11】什么是模型的“涌现能力”(Emergent Ability)?出现条件是什么?
人工智能·算法·ai·自然语言处理·面试·职场和发展
新缸中之脑2 小时前
如何合法地逆向SynthID
人工智能
剑穗挂着新流苏3123 小时前
115_PyTorch 实战:从零搭建 CIFAR-10 完整训练与测试流水线
人工智能·pytorch·深度学习·神经网络
Veggie263 小时前
【Java深度学习】PyTorch On Java 系列课程 第八章 17 :模型评估【AI Infra 3.0】[PyTorch Java 硕士研一课程]
java·人工智能·深度学习
妄汐霜3 小时前
小白学习笔记(spring框架的aop和tx)
笔记·学习
链上杯子4 小时前
《2026 LangChain零基础入门:用AI应用框架快速搭建智能助手》第8课(完结篇):小项目实战 + 部署 —— 构建网页版个人知识库 AI 助手
人工智能·langchain