第5章：神经网络

why1512023-08-15 8:06

神经元模型

上述定义的简单单元即为神经元模型。

多层网络

误差逆传播算法

标准BP算法：参数更新非常频繁，可能出现抵消现象。
积累BP算法：下降到一定程度上，进行下一步会非常缓慢。

过拟合

早停：划分训练集和验证集，若训练集误差降低而验证集升高则停止训练。
正则化：在误差目标函数中加入一个用于描述网络复杂度的部分， E = λ 1 m ∑ k = 1 m E k + ( 1 − λ ) ∑ i w i 2 E=\lambda\frac{1}{m}\sum_{k=1}^mE_k+(1-\lambda)\sum_iw_i^2 E=λm1∑k=1mEk+(1−λ)∑iwi2

全局最小与局部极小

局部极小解：是参数空间的某个点，其邻域点的误差函数值均不小于该点的误差函数值，可能存在多个。
全局极小解：是指参数空间中所有点的误差函数值均不小于该点的误差函数值，只存在一个。

如何跳出局部极小值点？

以多组不同参数值初始化多个神经网络，取误差最小的解。
使用模拟退火，在每一步都有一定概率接受比当前解更差的算法。
使用随机梯度下，即便陷入局部极小点，它计算出来的梯度仍然可能不为0。

上一篇：实践专区、智能农业、论文大盘点 |人工智能第28期

下一篇：Telerik UI for ASP.NET Core Crack

热门推荐

01GitHub 镜像站点 022026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 03AI科技热点日报 | 2026年07月01日 04【AI】2026 年具身智能模型和世界模型总结 05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 062026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？072026 年 AI 大模型 & AI 编程工具实战全总结 082026 AI 编程工具选型横评：Cursor / Claude Code / Trae / Copilot 到底选谁（建议收藏·避坑版）092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？102026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片