大话机器学习-1.神经网络

神经网络是一层一层组织起来的一个层状结构。简单来说,就是由输入层,隐藏层,输出层组成。

输入层用于接受数据,节点数等于输入特征的维度。

隐藏层也就是神经网络进行思考的地方。

输出层就是产生预测结果。

神经网络最重要的一个步骤就是学习,那么他是如何学习呢?

实质上就是重复"进行前向传播计算损失函数进行反向传播进行更新权重",从而重复"反向传播"从而的得到最优参数。

导数

指的是函数值随自变量变化的速率

方向导数

指的是多元函数在某一个特定方向上的导数值。

最常用的方法就是利用梯度下降法,通过计算损失函数关联模型参数的梯度,从而优化模型参数。

简单的就是举一个例子:

目标是得到预测的房价,输入为面积,输出为房价。

该神经网络只有输入层,输出层。输出层没有激活函数

的简称,

这是输出层:

均方误差:

输入100平方米,真实值为300万元

设置随机值为

,于是

误差为200-300=-100

损失函数为

计算损失函数对w的梯度

计算损失函数对b的梯度

利用学习率更新模型参数

学习率为lr=0.0001

更新完一轮

如果有激活函数当然也要给激活函数求导,所以激活函数一定要可导

相关推荐
牧子川5 小时前
009-Transformer-Architecture
人工智能·深度学习·transformer
covco6 小时前
矩阵管理系统指南:拆解星链引擎的架构设计与全链路落地实践
大数据·人工智能·矩阵
沪漂阿龙6 小时前
AI大模型面试题:支持向量机是什么?间隔最大化、软间隔、核函数、LinearSVC 全面拆解
人工智能·算法·支持向量机
lifewange6 小时前
AI编写测试用例工具介绍
人工智能·测试用例
陕西字符6 小时前
2026 西安 豆包获客优化技术深度解析:企来客科技 AI 全域获客系统测评
大数据·人工智能
掘金安东尼6 小时前
GGUF、GPTQ、AWQ、EXL2、MLX、VMLX...运行大模型,为什么会有这么多格式?
人工智能
新知图书6 小时前
市场分析报告自动化生成(使用千问)
人工智能·ai助手·千问·高效办公
无心水6 小时前
【Hermes:安全、权限与生产环境】38、Hermes Agent 安全四层纵深:最小权限原则从理论到落地的完全指南
人工智能·安全·mcp协议·openclaw·养龙虾·hermes·honcho
旦莫6 小时前
AI驱动的纯视觉自动化测试:知识库里应该积累什么知识内容
人工智能·python·测试开发·pytest·ai测试
dfsj660117 小时前
第四章:深度学习革命
人工智能·深度学习