26深度学习|李哥1

一、概念知识

1、++线性函数与神经元++

有局限,只能是直线,不能成曲线

y = wx + b

就算多个神经元串联形成,他们之间也只是起到了传递作用,相当于只有一层

下面举例说明两层神经网络后仍然是线性的

上图可以写成等式:
r1=w1x1+w2x2+w3x3+w4x4+b1r_1 = w_1x_1 + w_2 x_2 + w_3x_3 + w_4x_4 + b_1r1=w1x1+w2x2+w3x3+w4x4+b1
r2=w5x1+w6x2+w7x3+w8x4+b2r_2 = w_5x_1 + w_6 x_2 + w_7x_3 + w_8x_4 + b_2r2=w5x1+w6x2+w7x3+w8x4+b2
r3=w9x1+w10x2+w11x3+w12x4+b3r_3= w_9x_1 + w_{10} x_2 + w_{11}x_3 + w_{12}x_4 + b_3r3=w9x1+w10x2+w11x3+w12x4+b3

z=c1r1+c2r2+c3r3+bz=c_1r_1 + c_2r_2 + c_3r_3+bz=c1r1+c2r2+c3r3+b

整理上述等式后得: z=α1x1+α2x2+α3x3+α4x4+b? z = α_1x_1 + α_2x_2 + α_3x_3 + α_4x_4 + b_? z=α1x1+α2x2+α3x3+α4x4+b? 其中 α1,α2,α3,α4α_1,α_2,α_3,α_4α1,α2,α3,α4为w?,b?w_?,b_?w?,b? 组成

===

上述线性方程组可以写成

无论多少层都是只有一层

因此提出激活函数 模拟曲线。


计算参数

记上述 {w1,w2,w3...w12,b1,b2,b3,c1,c2,c3,bw_1,w_2,w_3...w_{12},b_1,b_2,b_3,c_1,c_2,c_3,bw1,w2,w3...w12,b1,b2,b3,c1,c2,c3,b} = θ

该神经网络的参数一共有 34 + 3 + 31 + 1 = 19 个

2、激活函数与非线性

激活函数就像是生物神经受到刺激的阈值,当达到某个值时才会进行神经传递。

常见且简单的激活函数:sigmoid、relu

特点:处处可导(relu的0除外)
sigmoid

σ(z)=11+e−z\sigma(z) = \frac{1}{1+e^{-z}}σ(z)=1+e−z1

relu

常用这个,因为公式简单,计算方便,虽然在0处不可导

f(z)=max(0,z)f(z) = max(0,z)f(z)=max(0,z)

于是经过激活函数处理后就能得到更多非线性模型
out=sigmoid(w1x1+w2x2+w3x3+w4x4+b1)out = sigmoid(w_1x_1 + w_2x_2+w_3x_3+w_4x_4 + b_1)out=sigmoid(w1x1+w2x2+w3x3+w4x4+b1)

3、优化成非线性神经网络


r1=w1x1+w2x2+w3x3+w4x4+b1r_1 = w_1x_1 + w_2 x_2 + w_3x_3 + w_4x_4 + b_1r1=w1x1+w2x2+w3x3+w4x4+b1
r2=w5x1+w6x2+w7x3+w8x4+b2r_2 = w_5x_1 + w_6 x_2 + w_7x_3 + w_8x_4 + b_2r2=w5x1+w6x2+w7x3+w8x4+b2
r3=w9x1+w10x2+w11x3+w12x4+b3r_3= w_9x_1 + w_{10} x_2 + w_{11}x_3 + w_{12}x_4 + b_3r3=w9x1+w10x2+w11x3+w12x4+b3

z=c1δ(r1)+c2δ(r2)+c3δ(r3)+bz=c_1δ(r_1) + c_2δ(r_2) + c_3δ(r_3)+bz=c1δ(r1)+c2δ(r2)+c3δ(r3)+b

简单来说就是下图

y^=b+cTσ(Wx+b) \hat{y} = b + c^T \sigma(Wx + b) y^=b+cTσ(Wx+b)

4、调参

神经网络

正向求y^\hat{y}y^ 得 loss = | y^\hat{y}y^ - yyy |

反向求导求w,bw,bw,b 不断调整w,bw,bw,b

注意调整过程中的三种情况

过拟合:408刷历年真题刷多了,就过拟合,导致新的考卷做不来(说的就是26考研)

二、神经网络 == 深度学习

上述概念只需了解,中间的具体过程都是黑匣子,只需调参,获得最优解即可

Neural Network == Deep Learning

  • 神经网络可以完成超级复杂任务(人脸识别),但简单问题需要先验知识解决,比如发现数字规律
相关推荐
Lei活在当下14 小时前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai
冬奇Lab15 小时前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
冬奇Lab16 小时前
Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
人工智能·agent
hboot16 小时前
AI工程师第二课 - 数据处理
人工智能·python·数据分析
程序员cxuan16 小时前
DeepSeek 杀入多模态,识图功能正式上线!
人工智能·后端·程序员
米小虾18 小时前
告别单打独斗:2026年多Agent协作架构实战指南
人工智能·agent
IT_陈寒19 小时前
SpringBoot这个自动配置坑我跳了三次
前端·人工智能·后端
Larcher19 小时前
AI Loop:让AI像人一样自主完成任务的核心机制
javascript·人工智能·设计模式
牧艺19 小时前
从零到协同:构建类飞书在线文档系统的五个技术重难点
前端·人工智能