李沐动手学习深度学习——3.7练习

尝试调整超参数,例如批量大小、迭代周期数和学习率,并查看结果。

  1. num_epochs = 10, batch_size = 256, lr = 0.1情况下

  2. num_epochs = 5, batch_size = 256, lr = 0.1情况下

    可以尝试一下,三种参数变化,会发现lr变小,需要的训练次数num_epochs增加,batch_size变小。

增加迭代周期的数量。为什么测试精度会在一段时间后降低?我们怎么解决这个问题?

因为过拟合问题,模型过于拟合训练集数据了,应对测试集与训练集存在一些不同的数据识别不出来。

  1. 降低num_epochs
  2. 数据增强,对于输入数据加一点噪声
  3. 降低模型复杂度,减少神经元
相关推荐
张较瘦_4 分钟前
[论文阅读] AI + 软件工程 | 3340个Python ML项目实证:PyQu工具+61种代码变更,精准提升软件质量!
论文阅读·人工智能·软件工程
m0_748248028 分钟前
C++20 协程:在 AI 推理引擎中的深度应用
java·c++·人工智能·c++20
蒙奇D索大16 分钟前
【11408学习记录】考研数学核心考点精讲:二维随机变量(离散与连续)全面解析
笔记·学习·考研·概率论·改行学it
Nebula_g21 分钟前
C语言应用实例:硕鼠游戏,田忌赛马,搬桌子,活动选择(贪心算法)
c语言·开发语言·学习·算法·游戏·贪心算法·初学者
leafff12323 分钟前
一文了解-大语言模型训练 vs 推理:硬件算力需求数据对比
人工智能·语言模型·自然语言处理
知花实央l30 分钟前
【Web应用实战】 文件上传漏洞实战:Low/Medium/High三级绕过(一句话木马拿webshell全流程)
前端·学习·网络安全·安全架构
snakecy31 分钟前
信息系统项目管理师--论文case
大数据·学习·职场和发展·区块链
天狗下凡1 小时前
【OpenGL学习】第2课:用OpenGL创建第一个窗口
学习
CareyWYR1 小时前
每周AI论文速递(251103-251107)
人工智能
AI科技星1 小时前
张祥前统一场论动量公式P=m(C-V)误解解答
开发语言·数据结构·人工智能·经验分享·python·线性代数·算法