目录

神经网络基础

神经网络的基本组成元素

一个神经元:

单层神经网络:

多层神经网络:(前向计算)

为什么要使用激活函数

如果不使用激活函数,每层只对上层的输入进行线性变换,实际这些线性变换可以归为一层即可。如果神经网络中只存在这样的线性运算的话,那么多层的神经网络其实可以被转换为单层的神经网络,即多层的神经网络和单层的神经网络实际表达的能力是一样的。因此引入非线性的激活函数,这样防止多层的神经网络塌缩成单一的神经网络。运用它也可以增加表达能力来拟合更加复杂的函数。

常见激活函数

输出层

输出层具有多种形态,它取决于你想让模型去输出什么样的数据。

如何训练神经网络

想要训练神经网络,首先要设定一个目标,然后冲着目标对神经网络进行调整。

例1:回归问题,降低损失函数的值:

例2:文本分类任务:最小化交叉熵

交叉熵具体计算过程:

最小化损失函数方法:在神经网络中通常采用梯度下降法

反向传播:

本文是转载文章,点击查看原文
如有侵权,请联系 xyy@jishuzhan.net 删除
相关推荐
量子位8 分钟前
挤爆字节服务器的 Agent 到底啥水平?一手实测来了
人工智能·aigc
量子位9 分钟前
狸谱 App 负责人一休:从 “叫爸爸” 小游戏到百万月活 AI 爆款,社交传播有这些底层逻辑丨中国 AIGC 产业峰会
人工智能·aigc
机器之心10 分钟前
ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择
人工智能
Dm_dotnet17 分钟前
使用这个工具,基于代码仓库直接生成教程文档,感觉比我自己写的还好
人工智能
机器之心31 分钟前
业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10
人工智能
新智元31 分钟前
大学文凭成废纸?AI 暴击美国 00 后!他哥大退学成千万富翁,我却还要还学贷
人工智能·openai
财经汇报32 分钟前
媒体关注:联易融聚焦AI+业务,重塑供应链金融生态
人工智能·金融·媒体
姚家湾34 分钟前
闲聊人工智能对媒体的影响
人工智能·媒体
程序员安仔40 分钟前
Trae 新版发布!除了支持联网搜索、 MCP 外,还能创建智能体!
人工智能·trae
新智元1 小时前
Transformer 原作打脸 DeepSeek 观点?一句 Wait 就能引发反思,RL 都不用
人工智能·openai