【跟马少平老师学AI】-【神经网络是怎么实现的】(六)过拟合问题

一句话归纳:
1)过拟合问题:

  • 图中的点为样本
  • 直线欠拟合
  • 曲线2过拟合

2)迭代次数与拟合情况:

  • 训练次数过多可能导致过拟合。

3)正则化项法弱化过拟后问题:

  • 加正则项,在最小化损失函数时抑制了个别参数影响过大导致的过拟合。

4)舍弃法弱化过拟合:

  • 通过训练多个简化的神经网络(丢弃部分参数)弱化过拟合。
  • 又保持使用过所有神经元。

5)数据增强法:

  • 训练数据足够多(样本多样性)。
  • 通过旋转、截取、缩放等方法获取数据。
相关推荐
枫叶林FYL几秒前
【自然语言处理 NLP】7.2 红队测试与对抗鲁棒性(Red Teaming & Adversarial Robustness)
人工智能·算法·机器学习
ZGi.ai1 分钟前
GraphRAG为什么让AI告别幻觉?从分块检索到知识图谱的演进
人工智能·知识图谱
速易达网络3 分钟前
2026 AI 技术十大趋势:大模型、Agent 与边缘智能的全面爆发
人工智能
陈天伟教授4 分钟前
心电心音同步分析-案例:原型设计一
开发语言·人工智能·python·语言模型·架构
Deepoch5 分钟前
VLA架构焕新智能轮椅 从被动避障到主动预判
人工智能·具身模型·deepoc
Ar-Sr-Na6 分钟前
STM32现代化AI开发指南-VSCode环境配置(macOS)
c语言·人工智能·vscode·stm32·嵌入式硬件·硬件工程
Allen_LVyingbo7 分钟前
量子计算Dirac Notation基本教学—从零基础到读懂量子信息论文(下)
开发语言·人工智能·python·数学建模·量子计算
乐园游梦记7 分钟前
机器学习:监督学习与无监督学习由浅入深全解析
人工智能·深度学习·学习·机器学习
Forrit9 分钟前
LLM微调后怎么评估好坏?
人工智能·transformer
坤岭10 分钟前
大模型“入侵”广告推荐
人工智能·langchain·推荐算法