26深度学习|李哥1

一、概念知识

1、++线性函数与神经元++

有局限,只能是直线,不能成曲线

y = wx + b

就算多个神经元串联形成,他们之间也只是起到了传递作用,相当于只有一层

下面举例说明两层神经网络后仍然是线性的

上图可以写成等式:
r1=w1x1+w2x2+w3x3+w4x4+b1r_1 = w_1x_1 + w_2 x_2 + w_3x_3 + w_4x_4 + b_1r1=w1x1+w2x2+w3x3+w4x4+b1
r2=w5x1+w6x2+w7x3+w8x4+b2r_2 = w_5x_1 + w_6 x_2 + w_7x_3 + w_8x_4 + b_2r2=w5x1+w6x2+w7x3+w8x4+b2
r3=w9x1+w10x2+w11x3+w12x4+b3r_3= w_9x_1 + w_{10} x_2 + w_{11}x_3 + w_{12}x_4 + b_3r3=w9x1+w10x2+w11x3+w12x4+b3

z=c1r1+c2r2+c3r3+bz=c_1r_1 + c_2r_2 + c_3r_3+bz=c1r1+c2r2+c3r3+b

整理上述等式后得: z=α1x1+α2x2+α3x3+α4x4+b? z = α_1x_1 + α_2x_2 + α_3x_3 + α_4x_4 + b_? z=α1x1+α2x2+α3x3+α4x4+b? 其中 α1,α2,α3,α4α_1,α_2,α_3,α_4α1,α2,α3,α4为w?,b?w_?,b_?w?,b? 组成

===

上述线性方程组可以写成

无论多少层都是只有一层

因此提出激活函数 模拟曲线。


计算参数

记上述 {w1,w2,w3...w12,b1,b2,b3,c1,c2,c3,bw_1,w_2,w_3...w_{12},b_1,b_2,b_3,c_1,c_2,c_3,bw1,w2,w3...w12,b1,b2,b3,c1,c2,c3,b} = θ

该神经网络的参数一共有 34 + 3 + 31 + 1 = 19 个

2、激活函数与非线性

激活函数就像是生物神经受到刺激的阈值,当达到某个值时才会进行神经传递。

常见且简单的激活函数:sigmoid、relu

特点:处处可导(relu的0除外)
sigmoid

σ(z)=11+e−z\sigma(z) = \frac{1}{1+e^{-z}}σ(z)=1+e−z1

relu

常用这个,因为公式简单,计算方便,虽然在0处不可导

f(z)=max(0,z)f(z) = max(0,z)f(z)=max(0,z)

于是经过激活函数处理后就能得到更多非线性模型
out=sigmoid(w1x1+w2x2+w3x3+w4x4+b1)out = sigmoid(w_1x_1 + w_2x_2+w_3x_3+w_4x_4 + b_1)out=sigmoid(w1x1+w2x2+w3x3+w4x4+b1)

3、优化成非线性神经网络


r1=w1x1+w2x2+w3x3+w4x4+b1r_1 = w_1x_1 + w_2 x_2 + w_3x_3 + w_4x_4 + b_1r1=w1x1+w2x2+w3x3+w4x4+b1
r2=w5x1+w6x2+w7x3+w8x4+b2r_2 = w_5x_1 + w_6 x_2 + w_7x_3 + w_8x_4 + b_2r2=w5x1+w6x2+w7x3+w8x4+b2
r3=w9x1+w10x2+w11x3+w12x4+b3r_3= w_9x_1 + w_{10} x_2 + w_{11}x_3 + w_{12}x_4 + b_3r3=w9x1+w10x2+w11x3+w12x4+b3

z=c1δ(r1)+c2δ(r2)+c3δ(r3)+bz=c_1δ(r_1) + c_2δ(r_2) + c_3δ(r_3)+bz=c1δ(r1)+c2δ(r2)+c3δ(r3)+b

简单来说就是下图

y^=b+cTσ(Wx+b) \hat{y} = b + c^T \sigma(Wx + b) y^=b+cTσ(Wx+b)

4、调参

神经网络

正向求y^\hat{y}y^ 得 loss = | y^\hat{y}y^ - yyy |

反向求导求w,bw,bw,b 不断调整w,bw,bw,b

注意调整过程中的三种情况

过拟合:408刷历年真题刷多了,就过拟合,导致新的考卷做不来(说的就是26考研)

二、神经网络 == 深度学习

上述概念只需了解,中间的具体过程都是黑匣子,只需调参,获得最优解即可

Neural Network == Deep Learning

  • 神经网络可以完成超级复杂任务(人脸识别),但简单问题需要先验知识解决,比如发现数字规律
相关推荐
无心水25 分钟前
【Harness:设计规范】15、Harness 成熟度模型(H0-H3):你的 AI 智能体在第几层
人工智能·设计规范·openclaw·养龙虾·harness·hermes·honcho
Raink老师6 小时前
【AI面试临阵磨枪-79】实时数据 RAG:订单、商家、物流、天气、动态库存
人工智能·面试·职场和发展
脑极体6 小时前
点亮星河AI+鸿蒙,一座艺术场馆的日神觉醒
人工智能·华为·harmonyos
Cosolar7 小时前
Chroma向量库面试学习指南
数据库·人工智能·面试·职场和发展·数据库架构
BUG指挥官7 小时前
Claude Code的自动化编程
人工智能
意图共鸣7 小时前
意图共鸣科技《认知智能白皮书》——感知与执行分离:认知架构(CA)如何重塑大模型底层结构
人工智能·架构
等一个人的@7 小时前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
ZGi.ai7 小时前
人工审查节点:让自动化工作流多一步人工把关
运维·人工智能·自动化·人机协同·智能体工作流·人工审查
王莎莎-MinerU8 小时前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
盘古信息IMS8 小时前
盘古信息IMS V6 8.0重磅发布:以薪火AI数智平台点燃离散制造数智化引擎
大数据·人工智能·制造