【李宏毅】深度学习6:机器学习任务攻略

  1. 如果在测试集上的效果不佳,应该要做什么?
  2. Optimization 如何选择?
  3. 解决 overfitting 的方法?

测试集上的效果不佳

  1. 看训练数据的loss,是不是模型本身就没训练好?
    • 问题:model 太简单了,func set 中没有满足条件的 func (我觉得这就是一种欠拟合的状态吧)
    • 解决方案:使用更复杂的模型
  2. 优化法 Optimization 没有选对,比如通过梯度下降,结果收敛到局部最优。
  • 如何确定是 model 不够复杂还是优化法没有选对呢?可以先选择更复杂的模型,看有没有提升。假设换了更复杂的模型,还是没有学好的话,表明是 Optimization 的问题。

备注:如果训练层数变多,在训练集上的 loss 先减小后增大,这是的过拟合问题吗?(不是,因为过拟合是相对测试集来讲的,所以不是过拟合 overfitting

overfitting 的解决方案

mismatch

mismatch 是说训练和测试数据分布不一致带来的。不能靠增加训练数据来解决

相关推荐
皇族崛起4 分钟前
【视觉多模态】基于视觉AI的人物轨迹生成方案
人工智能·python·计算机视觉·图文多模态·视觉多模态
dundunmm7 分钟前
【每天一个知识点】本体论
人工智能·rag·本体论
nimadan128 分钟前
**免费有声书配音软件2025推荐,高拟真度AI配音与多场景
人工智能·python
jkyy201414 分钟前
汽车×大健康融合:智慧健康监测座舱成车企新赛道核心布局
大数据·人工智能·物联网·汽车·健康医疗
可触的未来,发芽的智生15 分钟前
完全原生态思考:从零学习的本质探索→刻石头
javascript·人工智能·python·神经网络·程序人生
凤希AI伴侣16 分钟前
重构与远见:凤希AI伴侣的看图升级与P2P算力共享蓝图-凤希AI伴侣-2026年1月12日
人工智能·重构·凤希ai伴侣
叫我:松哥17 分钟前
基于Flask+ECharts+Bootstrap构建的微博智能数据分析大屏
人工智能·python·信息可视化·数据分析·flask·bootstrap·echarts
倔强的石头10625 分钟前
什么是机器学习?—— 用 “买西瓜” 讲透核心逻辑
人工智能·机器学习
美团技术团队26 分钟前
KuiTest:基于大模型通识的UI交互遍历测试
人工智能
Study99626 分钟前
大语言模型的详解与训练
人工智能·ai·语言模型·自然语言处理·大模型·llm·agent