第5章:神经网络

神经元模型

上述定义的简单单元即为神经元模型。

多层网络



误差逆传播算法





  • 标准BP算法:参数更新非常频繁,可能出现抵消现象。
  • 积累BP算法:下降到一定程度上,进行下一步会非常缓慢。

过拟合

  • 早停:划分训练集和验证集,若训练集误差降低而验证集升高则停止训练。
  • 正则化:在误差目标函数中加入一个用于描述网络复杂度的部分, E = λ 1 m ∑ k = 1 m E k + ( 1 − λ ) ∑ i w i 2 E=\lambda\frac{1}{m}\sum_{k=1}^mE_k+(1-\lambda)\sum_iw_i^2 E=λm1∑k=1mEk+(1−λ)∑iwi2

全局最小与局部极小

  • 局部极小解:是参数空间的某个点,其邻域点的误差函数值均不小于该点的误差函数值,可能存在多个。
  • 全局极小解:是指参数空间中所有点的误差函数值均不小于该点的误差函数值,只存在一个。

如何跳出局部极小值点?

  • 以多组不同参数值初始化多个神经网络,取误差最小的解。
  • 使用模拟退火,在每一步都有一定概率接受比当前解更差的算法。
  • 使用随机梯度下,即便陷入局部极小点,它计算出来的梯度仍然可能不为0。
相关推荐
Gse0a362g7 分钟前
cuDNN深度神经网络计算库简介及卷积操作示例
人工智能·神经网络·dnn
OPHKVPS8 分钟前
Ni8mare高危漏洞来袭:黑客可远程劫持n8n服务器(CVE-2026-21858)
人工智能·microsoft
电磁脑机18 分钟前
人类分布式大脑架构与文明、技术、安全的底层逻辑——原创大脑架构理论研究
网络·分布式·神经网络·安全·架构
财经资讯数据_灵砚智能20 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月5日
大数据·人工智能·python·信息可视化·自然语言处理·ai编程
hui-梦苑27 分钟前
[GROMACS]模拟数据分析前轨迹文件生成-轨迹预处理
人工智能·算法·数据分析
龙文浩_28 分钟前
AI深度学习/PyTorch/神经网络相关
人工智能·pytorch·深度学习
飞翔的SA30 分钟前
MLX‑VLM :Mac本地跑通多模态大模型的开源项目!让图片、音频、视频理解一键上手
人工智能·python·macos·音视频
王忘杰33 分钟前
Claude Code 通过 CC Switch 使用OpenRoute免费模型和国产大模型 qwen/qwen3.6-plus:free
人工智能
Jp7gnUWcI35 分钟前
AI Compose Commit:用 AI 智能重构 Git 提交工作流
人工智能·git·重构
G皮T39 分钟前
【OpenClaw】思路转变:从 “传统UI测试” 到 “AI驱动的UI测试”
自动化测试·人工智能·ai·agent·测试·ui测试·openclaw