深度学习与神经网络 | 邱锡鹏 | 第七章学习笔记网络优化与正则化

丶Darling.2025-06-24 16:56

7.网络优化与正则化

文章目录

7.网络优化与正则化
- 7.1神经网络优化的特点
- [7.2 优化算法改进](#7.2 优化算法改进)
- [7.3 动态学习率](#7.3 动态学习率)
- [7.4 梯度方向优化](#7.4 梯度方向优化)
- [7.5 参数初始化](#7.5 参数初始化)
- [7.6 数据预处理](#7.6 数据预处理)
- [7.7 逐层规范化](#7.7 逐层规范化)
- [7.8 超参数优化](#7.8 超参数优化)
- [7.9 正则化](#7.9 正则化)
- [7.10 暂退法](#7.10 暂退法)
- [7.11 l1和l2正则化](#7.11 l1和l2正则化)
- [7.12 数据增强](#7.12 数据增强)

7.1神经网络优化的特点

所以找个平坦最小值就好了，不一定需要全局最小值

7.2 优化算法改进

7.3 动态学习率

总体趋势还是减少的。时不时变大是为了找到更好的局部最优

7.4 梯度方向优化

效果比随机梯度要好

7.5 参数初始化

上图通常用在循环网络中

7.6 数据预处理

问题就是会对参数初始化产生一定的影响，也会对优化产生一定的影响

标准差为0的数据没啥意义，直接就扔了

7.7 逐层规范化

7.8 超参数优化

7.9 正则化

7.10 暂退法

可以提高网络的泛化能力

7.11 l1和l2正则化

7.12 数据增强

可以增强模型泛化能力

上一篇：三相交流系统中的坐标变换（abc\αβ\dq）

下一篇：【题解-Acwing】1022. 宠物小精灵之收服

热门推荐

01GitHub 镜像站点 02幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 03AI科技热点日报 | 2026年07月01日 042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 09几个好用的ip纯净度检测网站 102026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？