【李宏毅】深度学习6:机器学习任务攻略

  1. 如果在测试集上的效果不佳,应该要做什么?
  2. Optimization 如何选择?
  3. 解决 overfitting 的方法?

测试集上的效果不佳

  1. 看训练数据的loss,是不是模型本身就没训练好?
    • 问题:model 太简单了,func set 中没有满足条件的 func (我觉得这就是一种欠拟合的状态吧)
    • 解决方案:使用更复杂的模型
  2. 优化法 Optimization 没有选对,比如通过梯度下降,结果收敛到局部最优。
  • 如何确定是 model 不够复杂还是优化法没有选对呢?可以先选择更复杂的模型,看有没有提升。假设换了更复杂的模型,还是没有学好的话,表明是 Optimization 的问题。

备注:如果训练层数变多,在训练集上的 loss 先减小后增大,这是的过拟合问题吗?(不是,因为过拟合是相对测试集来讲的,所以不是过拟合 overfitting

overfitting 的解决方案

mismatch

mismatch 是说训练和测试数据分布不一致带来的。不能靠增加训练数据来解决

相关推荐
Allen正心正念20254 分钟前
Model——文生图模型GPT-Image-2特性解析-20260420
人工智能·gpt·计算机视觉
Jmayday1 小时前
Pytorch:张量创建及运算
人工智能·pytorch·python
领麦微红外1 小时前
W-TRS-5.5D1传感器:充电桩的“温度卫士”,解锁安全高效充电新范式
人工智能·安全
SomeB1oody1 小时前
【Python深度学习】3.4. 循环神经网络(RNN)实战:预测股价
开发语言·人工智能·python·rnn·深度学习·机器学习
ACCELERATOR_LLC1 小时前
【DataWhale组队学习】DIY-LLM Task2 PyTorch 与资源核算
人工智能·pytorch·深度学习·大模型
Elastic 中国社区官方博客2 小时前
Elastic Security、Observability 和 Search 现在在你的 AI 工具中提供交互式 UI
大数据·运维·人工智能·elasticsearch·搜索引擎·安全威胁分析·可用性测试
一碗白开水一2 小时前
【目标跟踪综述】目标跟踪近3年技术研究,全面了解目标跟踪发展
人工智能·计算机视觉·目标跟踪
Promise微笑2 小时前
AI搜索时代的流量重构:GEO优化深度执行细节与把控体系
人工智能·重构
言萧凡_CookieBoty3 小时前
比 Vibe Coding 更可怕的,是 Vibe Design 吧
人工智能·ai编程