6.深度学习入门:神经网络是如何“思考”的?

  1. 从神经元到神经网络
    生物灵感:大脑有约860亿个神经元,每个接收信号、处理、然后传递给下一个。
    人工神经元:数学函数 y = f(w1x1 + w2x2 + ... + b)

🧠 单个神经元就像一个小决策器:

输入:x1, x2(比如温度、湿度)

权重:w1, w2(重要性)

偏置:b(基础阈值)

激活函数:f(决定是否"兴奋")

  1. 最简单的神经网络:感知机

    只能处理线性可分问题(如AND、OR)。

    要解决异或(XOR)问题,需要多层网络。

  2. 多层神经网络(MLP)

    输入层:接收原始数据(图片像素、房价特征)

隐藏层:提取抽象特征(可以有很多层→"深度"学习)

输出层:给出最终结果(分类概率、回归值)

📐 前向传播:数据从左到右流过网络,计算出预测值。

  1. 神经网络怎么学?------反向传播
    前向:计算预测值

损失:比较预测与真实值(如交叉熵损失)

反向:从输出层往输入层,计算每个权重的梯度(用链式法则)

更新:梯度下降法调整权重

重复多轮(epoch)

🧮 直观理解:

误差像涟漪一样从输出层向后传播,告诉每一层的神经元"你该为错误承担多少责任",然后它们修正自己的权重。

  1. 用Keras搭一个3层神经网络(10行代码)
python 复制代码
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

model = Sequential([
    Dense(64, activation='relu', input_shape=(20,)),  # 隐藏层1
    Dense(64, activation='relu'),                     # 隐藏层2
    Dense(1, activation='sigmoid')                   # 输出层(二分类)
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10, batch_size=32)
  1. 深度学习的"深"到底有多深?
    浅层网络:1-2个隐藏层(1990s)

深度网络:5-150层(2010s)

超深网络:如ResNet有1000+层(通过跳跃连接实现)

  1. 为什么深度学习现在这么火?
    数据爆炸:互联网每天产生海量标注数据

算力飞跃:GPU让矩阵运算快几千倍

算法突破:ReLU激活函数、Dropout、BatchNorm等

小结

神经网络通过多层非线性变换,可以拟合任意复杂函数。它是现代计算机视觉、自然语言处理的基石。下一篇我们将进入"计算机视觉",看看卷积神经网络如何看懂图像。

下一篇预告:《计算机视觉:让AI拥有一双"火眼金睛"》

相关推荐
用户018349301691 小时前
用Zustand管理AI多会话状态
人工智能
武子康3 小时前
调查研究-198 Agent 到底该记住什么?读懂《What Must Generalist Agents Remember?》
人工智能·openai·agent
aqi004 小时前
15天学会AI应用开发(九)利用Chroma持久化向量数据
人工智能·python·大模型·ai编程·ai应用
武子康5 小时前
调查研究-197 FAISS vs Elasticsearch 全面对比:从向量检索、全文搜索到 RAG 选型指南
人工智能·elasticsearch·agent
青禾网络6 小时前
Web 前端如何接入 AI 音效生成:从零到可用的完整方案
人工智能·设计模式
用户252736278146 小时前
【技术实战】用 Spring Boot + Vue3 + LM Studio 在本地跑通 RAG 知识库
人工智能
用户5191495848456 小时前
VBScript随机数生成器内部机制:从时间种子到密码令牌破解
人工智能·aigc
米小虾6 小时前
Context Engineering —— 知识与记忆的窗口
人工智能·agent
IT_陈寒6 小时前
Python里这个赋值坑,连老司机都能翻车
前端·人工智能·后端