第5章:神经网络

神经元模型

上述定义的简单单元即为神经元模型。

多层网络



误差逆传播算法





  • 标准BP算法:参数更新非常频繁,可能出现抵消现象。
  • 积累BP算法:下降到一定程度上,进行下一步会非常缓慢。

过拟合

  • 早停:划分训练集和验证集,若训练集误差降低而验证集升高则停止训练。
  • 正则化:在误差目标函数中加入一个用于描述网络复杂度的部分, E = λ 1 m ∑ k = 1 m E k + ( 1 − λ ) ∑ i w i 2 E=\lambda\frac{1}{m}\sum_{k=1}^mE_k+(1-\lambda)\sum_iw_i^2 E=λm1∑k=1mEk+(1−λ)∑iwi2

全局最小与局部极小

  • 局部极小解:是参数空间的某个点,其邻域点的误差函数值均不小于该点的误差函数值,可能存在多个。
  • 全局极小解:是指参数空间中所有点的误差函数值均不小于该点的误差函数值,只存在一个。

如何跳出局部极小值点?

  • 以多组不同参数值初始化多个神经网络,取误差最小的解。
  • 使用模拟退火,在每一步都有一定概率接受比当前解更差的算法。
  • 使用随机梯度下,即便陷入局部极小点,它计算出来的梯度仍然可能不为0。
相关推荐
Vane16 小时前
从零开发一个AI插件,经历了什么?
人工智能·后端
70asunflower6 小时前
2026年前沿人工智能语言模型评估:基于任务驱动的最佳模型选择路径
人工智能·语言模型·自然语言处理
geneculture6 小时前
《智能通信速分多次传输技术(VDMT)》专利文件的全文汉英双语对照版本
服务器·网络·人工智能·融智学的重要应用·哲学与科学统一性·融智时代(杂志)·人机间性
湘-枫叶情缘6 小时前
AI 编程时代 DDD 的理论重估:一种面向复杂业务与生成式智能的建模语言
人工智能·设计规范
DogDaoDao6 小时前
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病
人工智能·深度学习·程序员·大模型·github·ai编程·andrej-karpathy
Cosolar6 小时前
一文吃透 LangChain&LangGraph:设计理念、框架结构与内部组件全拆解
人工智能·面试·架构
Joseph Cooper6 小时前
RAG 与 AI Agent:智能体真的需要检索增强生成吗?
数据库·人工智能·ai·agent·rag·上下文工程
LaughingZhu6 小时前
Product Hunt 每日热榜 | 2026-04-29
人工智能·经验分享·深度学习·神经网络·产品运营
FindYou.7 小时前
机器学习day01(机器学习概述 + KNN算法)
人工智能·机器学习
β添砖java7 小时前
深度学习(17)卷积层里的多输入多输出通道
人工智能·pytorch·深度学习