【李宏毅】深度学习6:机器学习任务攻略

  1. 如果在测试集上的效果不佳,应该要做什么?
  2. Optimization 如何选择?
  3. 解决 overfitting 的方法?

测试集上的效果不佳

  1. 看训练数据的loss,是不是模型本身就没训练好?
    • 问题:model 太简单了,func set 中没有满足条件的 func (我觉得这就是一种欠拟合的状态吧)
    • 解决方案:使用更复杂的模型
  2. 优化法 Optimization 没有选对,比如通过梯度下降,结果收敛到局部最优。
  • 如何确定是 model 不够复杂还是优化法没有选对呢?可以先选择更复杂的模型,看有没有提升。假设换了更复杂的模型,还是没有学好的话,表明是 Optimization 的问题。

备注:如果训练层数变多,在训练集上的 loss 先减小后增大,这是的过拟合问题吗?(不是,因为过拟合是相对测试集来讲的,所以不是过拟合 overfitting

overfitting 的解决方案

mismatch

mismatch 是说训练和测试数据分布不一致带来的。不能靠增加训练数据来解决

相关推荐
16_one4 分钟前
autoDL安装Open-WebUi+Rag本地知识库问答+Function Calling
人工智能·后端·算法
智能交通技术7 分钟前
iTSTech:自动驾驶技术综述报告 2025
人工智能·机器学习·自动驾驶
清云逸仙31 分钟前
AI Prompt 工程最佳实践:打造结构化的Prompt
人工智能·经验分享·深度学习·ai·ai编程
todoitbo37 分钟前
基于Rokid CXR-M SDK实现AR智能助手应用:让AI大模型走进AR眼镜
人工智能·ai·ar·ar眼镜·rokid
hacker7071 小时前
openGauss 在K12教育场景的数据处理测评:CASE WHEN 实现高效分类
人工智能·分类·数据挖掘
暖光资讯1 小时前
前行者获2025抖音最具影响力品牌奖,亮相上海ZFX装备前线展,引领外设行业“文化科技”新浪潮
人工智能·科技
guslegend1 小时前
第3章:SpringAI进阶之会话记忆实战
人工智能
陈橘又青2 小时前
100% AI 写的开源项目三周多已获得 800 star 了
人工智能·后端·ai·restful·数据
松岛雾奈.2302 小时前
深度学习--TensorFlow框架使用
深度学习·tensorflow·neo4j
中杯可乐多加冰2 小时前
逻辑控制案例详解|基于smardaten实现OA一体化办公系统逻辑交互
人工智能·深度学习·低代码·oa办公·无代码·一体化平台·逻辑控制