PYTHON+AI LLM DAY FOURTY-THREE

今天聊聊人工神经网络模型(Artifical Neural Network ANN):一种模仿生物神经网络结构和功能的计算模型.相关概念:单个神经元接收输入信号,加权求和过后传给激活函数.许多个神经元组成了层,多个层之间的全连接组成了神经网络,深度学习所说的"深"也就是神经网络的层数很多,这也就是隐藏层,也就是所说的"黑箱",神经网络底层利用激活函数(对每层的输出数据进行变换,引入非线性因素,让模型能够拟合任意曲线)将接收的连续信息转换为非线性输出,与真实值比较,引入损失函数.这就是前向传播的过程.反向传播就是利用梯度下降法,更新,迭代参数的过程.参数初始化过程:对模型赋予初始参数,以便模型在后续优化的过程中持续进行.理论上是初始参数随便给,但是参数的选择会直接影响模型训练的复杂度,就是选对参数,可以让模型少走"弯路"常见的初始化参数方有:uniform_()

,normal_(),zeros_(),ones_(),constant_(),xvaier_uniform_(),xvaier_normal_(),kaiming_uniform(),

kaiming_normal_().至于选择哪种?先看模型的层数.如果隐藏层不太深,建议选tanh为激活函数,此时选择xvaier初始化方法较为妥当.如果隐藏层太深.选择tanh和sigmoid都会让梯度消失.此时选择Relu激活函数效果较好,也能缓解大模型的幻觉问题.这时选择kaiming初始化方法妥当.不论是xvaier还是kaiming初始化都兼顾了前向传播和反向传播的参数变化问题.在输出层二分类分体选用sigmoid激活函数,多分类选用softmax激活函数.

相关推荐
xieliyu.2 小时前
Java算法精讲:双指针(三)
java·开发语言·算法
我没胡说八道2 小时前
高校论文AI检测优化工具对比研究与实测分析(2026)
人工智能·深度学习·机器学习·计算机视觉·aigc·论文
秦亚伟2 小时前
AI浪潮重塑融资租赁行业新格局
人工智能
love530love2 小时前
LiveTalking 数字人项目 Windows 部署完全指南(EPGF 架构)
人工智能·windows·python·架构·livetalking·epgf
元启数宇2 小时前
喷淋AI布点实战:8小时人工布点→20分钟自动出图
人工智能
哈哈,柳暗花明2 小时前
人工智能专业术语详解(H)
人工智能·专业术语
圣殿骑士-Khtangc2 小时前
AI 编程工具 2026 实战横评:Cursor 3 vs Claude Code vs Copilot,开发者选型完全指南
人工智能·copilot
云器科技2 小时前
云器Lakehouse 2026年5月版本发布:拥抱 AI Agent,重塑数据智能开发新范式
人工智能
小鹰-上海鹰谷-电子实验记录本2 小时前
第六届党建引领科创生态座谈会 | 邓光辉博士出席分享AI赋能创新药科研新范式
人工智能·ai·电子实验记录本·药企合规
遇事不決洛必達2 小时前
【Python基础】GIL 锁是什么及其对爬虫的影响
爬虫·python·线程·进程·gil锁