【李宏毅】深度学习6:机器学习任务攻略

  1. 如果在测试集上的效果不佳,应该要做什么?
  2. Optimization 如何选择?
  3. 解决 overfitting 的方法?

测试集上的效果不佳

  1. 看训练数据的loss,是不是模型本身就没训练好?
    • 问题:model 太简单了,func set 中没有满足条件的 func (我觉得这就是一种欠拟合的状态吧)
    • 解决方案:使用更复杂的模型
  2. 优化法 Optimization 没有选对,比如通过梯度下降,结果收敛到局部最优。
  • 如何确定是 model 不够复杂还是优化法没有选对呢?可以先选择更复杂的模型,看有没有提升。假设换了更复杂的模型,还是没有学好的话,表明是 Optimization 的问题。

备注:如果训练层数变多,在训练集上的 loss 先减小后增大,这是的过拟合问题吗?(不是,因为过拟合是相对测试集来讲的,所以不是过拟合 overfitting

overfitting 的解决方案

mismatch

mismatch 是说训练和测试数据分布不一致带来的。不能靠增加训练数据来解决

相关推荐
凌杰2 小时前
AI 学习笔记:Agent 的能力体系
人工智能
IT_陈寒3 小时前
React状态管理终极对决:Redux vs Context API谁更胜一筹?
前端·人工智能·后端
舒一笑4 小时前
如何获取最新的技术趋势和热门技术
人工智能·程序员
聚客AI5 小时前
🎉OpenClaw深度解析:多智能体协同的三种模式、四大必装技能与自动化运维秘籍
人工智能·开源·agent
黄粱梦醒5 小时前
大模型企业级部署方案-vllm
人工智能·llm
IT_陈寒5 小时前
JavaScript代码效率提升50%?这5个优化技巧你必须知道!
前端·人工智能·后端
IT_陈寒5 小时前
Java开发必知的5个性能优化黑科技,提升50%效率不是梦!
前端·人工智能·后端
康斯坦丁师傅5 小时前
发现一个插件,免费用谷歌最新NanoBanana 2
人工智能
emo猫pro_max7 小时前
openclaw飞书流式回复配置指南
人工智能
FishCoderh7 小时前
被OpenClaw的Session搞晕了?这篇让你彻底搞懂
人工智能