【图文解说】BP神经网络与深度学习CNN的关系

本文来自《老饼讲解-BP神经网络》https://www.bbbdata.com/

目录

BP神经网络是一个经典、有效的算法,即使时至今日,在传统的"小数据"领域仍有卓越的拟合效果。而BP神经网络的更大贡献是,它开启了后来的CNN\RNN等深度学习模型的大门。本文简单讲解BP神经网络是与深度学习CNN的关系。

一、BP神经网络网络是什么

BP神经网络模仿人的大脑,将输入层层前馈并激活,从而得到最终的输出,BP神经网络的拓扑结构如下:

BP更多用于数值拟合,这时最常用的是三层BP神经网络,三层的BP神经网络只要隐节点足够多就足以拟合任意曲线。

二、BP神经网络用于图象识别问题

1.1.BP神经网络解决图象识别问题

由于BP神经网络可以拟合任意曲线,因此搭配softmax函数,进一步解决模式识别问题,包括图像的识别,例如"手写数字识别"。

手写数字是28×28的黑白图片,将它展平后就是28×28=784的输入,再投入到三层BP神经网络中进行训练,最终用于预测图片属于0-9各个数字的概率。通过一个简单的训练,就可以得到97.6%的识别准确率:

详细代码与训练过程可参考:《BP神经网络识别手写数字》

1.2.BP神经网络解决图象识别问题的困难

在上述手写字识别的图象识别问题中,BP神经网络是毫无压力的,但如果企图用于更大的图片,会面临参数爆炸的问题。例如224×224=50176的图片,那么就有5W个输入,进一步地,网络的隐节点即使只有1W,也会有5亿个隐层权重,这将给求解带来极大的困难。

三、从BP到CNN深度学习模型

由于BP神经网络在图片识别上有参数维度灾难,那么最简单的就是减少输入的个数就可以了!是的,直接把224×224的图片,压缩成24×24的图片不就可以了吗?!

事实上,CNN就是这么做的,但它采用了更加智能的压缩方法--加入了卷积层与池化层来自动压缩图片。一个卷积层的示例如下,通过卷积核,可以将输入内容进行整合、压缩。

一个卷积神经网络CNN的基本结构如下:

CNN通过C(卷积层)与P(池化层),逐步将图片进行压缩,使得图片的Size缩小,小到一定程度时,再投入三层的BP神经网络中(F6,F7)中拟合输出就可以了。
备注:由于卷积层是稀疏连接,BP则是全连接,所以CNN中一般以F(Full Connect)层来指代BP。

使用pytorch实现一个卷积神经网络,用于数字识别,简简单单就能得到99.8%的准确率,可见CNN的效果要比BP要好得多。

从上可以看到,随着卷积与池化的加入,网络的层数就加深了,在后来,层数越来越深,也就有了深度学习一说。


相关链接:

《老饼讲解-机器学习》:老饼讲解-机器学习教程-通俗易懂

《老饼讲解-神经网络》:老饼讲解-matlab神经网络-通俗易懂

《老饼讲解-神经网络》:老饼讲解-深度学习-通俗易懂

相关推荐
一个王同学1 小时前
从零到一 | CV转多模态大模型 | week09 | Minillava Refactor结合手搓和llava源码深入理解多模态大模型原理
人工智能·深度学习·机器学习·计算机视觉·改行学it
赢乐2 小时前
大模型学习笔记:检索增强生成(RAG)架构
人工智能·python·深度学习·机器学习·智能体·幻觉·检索增强生成(rag)
多年小白9 小时前
紫光国微(002049) 分析
大数据·科技·深度学习·ai
动物园猫9 小时前
金属外表多种生锈检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·分类
cyyt9 小时前
深度学习周报(5.11~5.17)
人工智能·深度学习
搬砖的小码农_Sky9 小时前
如何在RX 7900 XTX显卡上运行ROCm?
深度学习·机器学习·gpu算力
RSTJ_162510 小时前
PYTHON+AI LLM DAY FOURTY-EIGHT
开发语言·人工智能·python·深度学习
Cosolar11 小时前
AI Agent 记忆机制全景对比:OpenClaw vs QwenPaw vs Hermes vs HiClaw
人工智能·深度学习·语言模型·chatgpt·面试
禾刀围玉11 小时前
基于FPGA的卷积神经网络实现-Step2 卷积模块设计
人工智能·fpga开发·cnn
摄影图12 小时前
神经网络创意科技图片素材 满足多场景科技设计创作需求
人工智能·科技·神经网络·aigc·插画