大话机器学习-1.神经网络

神经网络是一层一层组织起来的一个层状结构。简单来说,就是由输入层,隐藏层,输出层组成。

输入层用于接受数据,节点数等于输入特征的维度。

隐藏层也就是神经网络进行思考的地方。

输出层就是产生预测结果。

神经网络最重要的一个步骤就是学习,那么他是如何学习呢?

实质上就是重复"进行前向传播计算损失函数进行反向传播进行更新权重",从而重复"反向传播"从而的得到最优参数。

导数

指的是函数值随自变量变化的速率

方向导数

指的是多元函数在某一个特定方向上的导数值。

最常用的方法就是利用梯度下降法,通过计算损失函数关联模型参数的梯度,从而优化模型参数。

简单的就是举一个例子:

目标是得到预测的房价,输入为面积,输出为房价。

该神经网络只有输入层,输出层。输出层没有激活函数

的简称,

这是输出层:

均方误差:

输入100平方米,真实值为300万元

设置随机值为

,于是

误差为200-300=-100

损失函数为

计算损失函数对w的梯度

计算损失函数对b的梯度

利用学习率更新模型参数

学习率为lr=0.0001

更新完一轮

如果有激活函数当然也要给激活函数求导,所以激活函数一定要可导

相关推荐
那个村的李富贵4 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
腾讯云开发者5 小时前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR5 小时前
每周AI论文速递(260202-260206)
人工智能
hopsky6 小时前
大模型生成PPT的技术原理
人工智能
禁默7 小时前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann
心疼你的一切7 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
AI绘画哇哒哒7 小时前
【干货收藏】深度解析AI Agent框架:设计原理+主流选型+项目实操,一站式学习指南
人工智能·学习·ai·程序员·大模型·产品经理·转行
数据分析能量站7 小时前
Clawdbot(现名Moltbot)-现状分析
人工智能
那个村的李富贵7 小时前
CANN加速下的AIGC“即时翻译”:AI语音克隆与实时变声实战
人工智能·算法·aigc·cann
二十雨辰8 小时前
[python]-AI大模型
开发语言·人工智能·python