【西瓜书机器学习】第五章神经网络

急急黄豆2024-05-11 15:14

一起啃西瓜书(5)-神经网络《机器学习-周志华》 - 知乎 (zhihu.com)参考进行自我复习整理，侵删！

1、神经元模型

神经网络定义：神经网络是由 具有适应性 的 简单单元 组成的广泛 并行互连 的网络。
M-P神经元模型：输入、处理、输出

第二步超过阈值则兴奋（做出反应），否则不兴奋（没反应），通过f(x)阶跃函数实现，但阶跃函数不连续，使用sigmoid函数。

2、感知机

组成：两层，输入层 接受外界信号、输出层是"M-P神经元"。
明确：输入层 的神经元不是"M-P神经元"，他们**没有"阈值"**可言，无激活函数
把阈值转换为类似权重*输入值 的形式：
学习规则：对于一个样例（x,y），当前感知机的输出为 𝑦^，也就是y为根据x得到的真实的y，也是我们期望感知机能得到的y，但是感知机实际输出的为 𝑦^，两者之间的差距为y- 𝑦^，为了使输出更接近，也就是使y- 𝑦^最小化，我们需要调整感知机参数（所有权重及阈值，阈值已经被转换为了权重形式），调整公式如下：

也就是学习率越大，调整幅度越大；感知机输出与实际之间的差距越大，调整幅度越大；该神经元的输入值越大，调整幅度越大。同时我们也可以得到如下结论：

若感知机预测正确，不需要调整
w向着预测正确的方向调整
根据错误的程度对参数进行调

可解决问题：线性可分问题。也就是在坐标系中两种类型之间可以用一条线划分开，比如与或非问题可划分如下，其中蓝色为正样本，绿色为负样本。

但是异或问题至少要用两条线才可分割开，如下图所示，这也就意味着感知机无法解决该问题，需要引入两层感知机来解决。

上一篇：MT8370_联发科MTK8370(Genio 510)芯片性能规格参数

下一篇：Java——多态

热门推荐

01UV安装并设置国内源 02Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 03KGG转MP3工具|非KGM文件|解密音频 04【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）052025最新国内服务器可用docker源仓库地址大全（2025年8月更新）06蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 07TRAE Rules 实践：为项目配置 6A 工作流 08全球最强模型Grok4，国内已可免费使用！（附教程）09GPT-5 使用限制与国内升级全攻略（免费 / Plus / Pro）【2025 最新】10NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南