6.深度学习入门:神经网络是如何“思考”的?

  1. 从神经元到神经网络
    生物灵感:大脑有约860亿个神经元,每个接收信号、处理、然后传递给下一个。
    人工神经元:数学函数 y = f(w1x1 + w2x2 + ... + b)

🧠 单个神经元就像一个小决策器:

输入:x1, x2(比如温度、湿度)

权重:w1, w2(重要性)

偏置:b(基础阈值)

激活函数:f(决定是否"兴奋")

  1. 最简单的神经网络:感知机

    只能处理线性可分问题(如AND、OR)。

    要解决异或(XOR)问题,需要多层网络。

  2. 多层神经网络(MLP)

    输入层:接收原始数据(图片像素、房价特征)

隐藏层:提取抽象特征(可以有很多层→"深度"学习)

输出层:给出最终结果(分类概率、回归值)

📐 前向传播:数据从左到右流过网络,计算出预测值。

  1. 神经网络怎么学?------反向传播
    前向:计算预测值

损失:比较预测与真实值(如交叉熵损失)

反向:从输出层往输入层,计算每个权重的梯度(用链式法则)

更新:梯度下降法调整权重

重复多轮(epoch)

🧮 直观理解:

误差像涟漪一样从输出层向后传播,告诉每一层的神经元"你该为错误承担多少责任",然后它们修正自己的权重。

  1. 用Keras搭一个3层神经网络(10行代码)
python 复制代码
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

model = Sequential([
    Dense(64, activation='relu', input_shape=(20,)),  # 隐藏层1
    Dense(64, activation='relu'),                     # 隐藏层2
    Dense(1, activation='sigmoid')                   # 输出层(二分类)
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10, batch_size=32)
  1. 深度学习的"深"到底有多深?
    浅层网络:1-2个隐藏层(1990s)

深度网络:5-150层(2010s)

超深网络:如ResNet有1000+层(通过跳跃连接实现)

  1. 为什么深度学习现在这么火?
    数据爆炸:互联网每天产生海量标注数据

算力飞跃:GPU让矩阵运算快几千倍

算法突破:ReLU激活函数、Dropout、BatchNorm等

小结

神经网络通过多层非线性变换,可以拟合任意复杂函数。它是现代计算机视觉、自然语言处理的基石。下一篇我们将进入"计算机视觉",看看卷积神经网络如何看懂图像。

下一篇预告:《计算机视觉:让AI拥有一双"火眼金睛"》

相关推荐
hyunbar几秒前
扣子(coze)高级实战-【今日头条】输入关键词批量采集,循环写入飞书多维表格
人工智能·ai编程
victory0431几秒前
DeepSeek-R1 86页加长版:通过强化学习激励大语言模型的推理能力 技术报告中文翻译
人工智能
郑寿昌2 分钟前
2026传感器革命:智能感知新纪元
人工智能
杰之行2 分钟前
Fast-DDS Transport 层架构详解
c++·人工智能
陈天伟教授2 分钟前
图解人工智能(19)机器学习基本流程
人工智能
lusasky4 分钟前
GPU芯片那些事
人工智能
码农阿强6 分钟前
技术解析|doubao‑seedance 全系列模型深度解读:API 开放生态赋能 AI 视频生成工程化
人工智能·音视频
大拿爱科技7 分钟前
声音克隆接入短视频流程时,哪些环节最容易出问题?
人工智能·aigc·音视频·语音识别
人月神话-Lee8 分钟前
【图像处理】二值化与阈值——从灰度到黑白的决策
图像处理·人工智能·计算机视觉
瑞华丽PLM8 分钟前
瑞华丽工业软件研发效能全景展示
人工智能·算法·cae·工业软件·国产软件·瑞华丽plm·瑞华丽