【李宏毅】深度学习6:机器学习任务攻略

  1. 如果在测试集上的效果不佳,应该要做什么?
  2. Optimization 如何选择?
  3. 解决 overfitting 的方法?

测试集上的效果不佳

  1. 看训练数据的loss,是不是模型本身就没训练好?
    • 问题:model 太简单了,func set 中没有满足条件的 func (我觉得这就是一种欠拟合的状态吧)
    • 解决方案:使用更复杂的模型
  2. 优化法 Optimization 没有选对,比如通过梯度下降,结果收敛到局部最优。
  • 如何确定是 model 不够复杂还是优化法没有选对呢?可以先选择更复杂的模型,看有没有提升。假设换了更复杂的模型,还是没有学好的话,表明是 Optimization 的问题。

备注:如果训练层数变多,在训练集上的 loss 先减小后增大,这是的过拟合问题吗?(不是,因为过拟合是相对测试集来讲的,所以不是过拟合 overfitting

overfitting 的解决方案

mismatch

mismatch 是说训练和测试数据分布不一致带来的。不能靠增加训练数据来解决

相关推荐
冬奇Lab9 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab9 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan11 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi13 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒14 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒15 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户16931761726615 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟15 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781416 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩16 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent