神经网络基础-神经网络补充概念-50-学习率衰减

概念

学习率衰减(Learning Rate Decay)是一种优化算法,在训练深度学习模型时逐渐减小学习率,以便在训练的后期更加稳定地收敛到最优解。学习率衰减可以帮助在训练初期更快地靠近最优解,而在接近最优解时减小学习率可以使模型更精细地调整参数,从而更好地收敛。

实现方式

学习率衰减可以通过以下几种方式实现:

定期衰减:在训练的每个固定的迭代步骤,将学习率乘以一个衰减因子(通常小于1)。

指数衰减:使用指数函数来衰减学习率,例如每隔一定迭代步骤,将学习率按指数函数进行衰减。

分段衰减:将训练过程分成多个阶段,每个阶段使用不同的学习率。

代码实现(定期衰减)

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

# 生成随机数据
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 添加偏置项
X_b = np.c_[np.ones((100, 1)), X]

# 初始化参数
theta = np.random.randn(2, 1)

# 初始学习率
initial_learning_rate = 0.1

# 衰减因子
decay_factor = 0.9

# 迭代次数
n_iterations = 1000

# 学习率衰减
for iteration in range(n_iterations):
    learning_rate = initial_learning_rate / (1 + decay_factor * iteration)
    gradients = 2 / 100 * X_b.T.dot(X_b.dot(theta) - y)
    theta = theta - learning_rate * gradients

# 绘制数据和拟合直线
plt.scatter(X, y)
plt.plot(X, X_b.dot(theta), color='red')
plt.xlabel('X')
plt.ylabel('y')
plt.title('Linear Regression with Learning Rate Decay')
plt.show()

print("Intercept (theta0):", theta[0][0])
print("Slope (theta1):", theta[1][0])
相关推荐
继续商行8 分钟前
Go性能调优实战:从pprof火焰图到内存逃逸分析的完整优化路径
人工智能
数智工坊14 分钟前
周志华《Machine Learning》学习笔记--第十二章--计算学习理论
笔记·学习·机器学习
小小测试开发6 小时前
安装 Python 3.10+
开发语言·人工智能·python
KaMeidebaby7 小时前
卡梅德生物技术快报|PD1 单克隆抗体定制配套 N 糖全谱质控开发
前端·人工智能·算法·数据挖掘·数据分析
我叫唧唧波7 小时前
Python+AI 全栈学习笔记
人工智能·python·学习
哈哈,柳暗花明8 小时前
人工智能专业术语详解(E)
人工智能·专业术语
城北徐宫8 小时前
Linux信号深度解剖:5种产生、3张表、4次切换
linux·c++·学习
AI极客菌8 小时前
AI绘画工具中,为什么专业玩家爱用Stable Diffusion,普通玩家却喜欢Midjourney?
大数据·人工智能·ai·ai作画·stable diffusion·aigc·midjourney
人工智能AI技术8 小时前
FLUX.2[klein]开源!小香蕉平替,本地部署AI绘画的极简方案
人工智能·ai作画·aigc
腾视科技AI8 小时前
腾视科技大模型一体机解决方案:低成本私有化落地,重塑行业智能应用新格局
大数据·人工智能·科技·ai·边缘计算·算力·ai算力