6.深度学习入门:神经网络是如何“思考”的?

  1. 从神经元到神经网络
    生物灵感:大脑有约860亿个神经元,每个接收信号、处理、然后传递给下一个。
    人工神经元:数学函数 y = f(w1x1 + w2x2 + ... + b)

🧠 单个神经元就像一个小决策器:

输入:x1, x2(比如温度、湿度)

权重:w1, w2(重要性)

偏置:b(基础阈值)

激活函数:f(决定是否"兴奋")

  1. 最简单的神经网络:感知机

    只能处理线性可分问题(如AND、OR)。

    要解决异或(XOR)问题,需要多层网络。

  2. 多层神经网络(MLP)

    输入层:接收原始数据(图片像素、房价特征)

隐藏层:提取抽象特征(可以有很多层→"深度"学习)

输出层:给出最终结果(分类概率、回归值)

📐 前向传播:数据从左到右流过网络,计算出预测值。

  1. 神经网络怎么学?------反向传播
    前向:计算预测值

损失:比较预测与真实值(如交叉熵损失)

反向:从输出层往输入层,计算每个权重的梯度(用链式法则)

更新:梯度下降法调整权重

重复多轮(epoch)

🧮 直观理解:

误差像涟漪一样从输出层向后传播,告诉每一层的神经元"你该为错误承担多少责任",然后它们修正自己的权重。

  1. 用Keras搭一个3层神经网络(10行代码)
python 复制代码
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

model = Sequential([
    Dense(64, activation='relu', input_shape=(20,)),  # 隐藏层1
    Dense(64, activation='relu'),                     # 隐藏层2
    Dense(1, activation='sigmoid')                   # 输出层(二分类)
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10, batch_size=32)
  1. 深度学习的"深"到底有多深?
    浅层网络:1-2个隐藏层(1990s)

深度网络:5-150层(2010s)

超深网络:如ResNet有1000+层(通过跳跃连接实现)

  1. 为什么深度学习现在这么火?
    数据爆炸:互联网每天产生海量标注数据

算力飞跃:GPU让矩阵运算快几千倍

算法突破:ReLU激活函数、Dropout、BatchNorm等

小结

神经网络通过多层非线性变换,可以拟合任意复杂函数。它是现代计算机视觉、自然语言处理的基石。下一篇我们将进入"计算机视觉",看看卷积神经网络如何看懂图像。

下一篇预告:《计算机视觉:让AI拥有一双"火眼金睛"》

相关推荐
继续商行21 分钟前
Go性能调优实战:从pprof火焰图到内存逃逸分析的完整优化路径
人工智能
小小测试开发6 小时前
安装 Python 3.10+
开发语言·人工智能·python
KaMeidebaby7 小时前
卡梅德生物技术快报|PD1 单克隆抗体定制配套 N 糖全谱质控开发
前端·人工智能·算法·数据挖掘·数据分析
我叫唧唧波7 小时前
Python+AI 全栈学习笔记
人工智能·python·学习
哈哈,柳暗花明8 小时前
人工智能专业术语详解(E)
人工智能·专业术语
AI极客菌8 小时前
AI绘画工具中,为什么专业玩家爱用Stable Diffusion,普通玩家却喜欢Midjourney?
大数据·人工智能·ai·ai作画·stable diffusion·aigc·midjourney
人工智能AI技术8 小时前
FLUX.2[klein]开源!小香蕉平替,本地部署AI绘画的极简方案
人工智能·ai作画·aigc
腾视科技AI8 小时前
腾视科技大模型一体机解决方案:低成本私有化落地,重塑行业智能应用新格局
大数据·人工智能·科技·ai·边缘计算·算力·ai算力
pusheng20258 小时前
IFSJ全英文专访:中国创新力量重塑先进气体感知技术,赋能全球关键基础设施安全
前端·网络·人工智能·物联网·安全
魔点科技8 小时前
魔点门禁门常开计划解决早高峰排队、忘落锁、多门手动调模式痛点
人工智能·智能硬件·智能门禁·考勤门禁·魔点科技