【机器学习05】神经网络、模型表示、前向传播、TensorFlow实现

一、神经网络简介 (Introduction to Neural Networks)
- [1.1 什么是神经网络](#1.1 什么是神经网络)
- [1.2 神经网络为何现在如此强大？](#1.2 神经网络为何现在如此强大？)
二、神经网络的模型表示
- [2.1 单个神经元：逻辑回归单元](#2.1 单个神经元：逻辑回归单元)
- [2.2 构建网络：层 (Layers)](#2.2 构建网络：层 (Layers))
- [2.3 神经网络如何自动学习特征](#2.3 神经网络如何自动学习特征)
三、前向传播 (Forward Propagation)
- [3.1 逐层计算详解](#3.1 逐层计算详解)
- [3.2 更复杂的网络与数学符号](#3.2 更复杂的网络与数学符号)
- [3.3 完整示例：手写数字识别](#3.3 完整示例：手写数字识别)
- [3.4 神经网络的应用实例](#3.4 神经网络的应用实例)
[四、代码实现：使用 TensorFlow](#四、代码实现：使用 TensorFlow)
- [4.1 [附录] 关于 NumPy 数组的说明](#4.1 [附录] 关于 NumPy 数组的说明)

一、神经网络简介 (Introduction to Neural Networks)

经过对线性回归和逻辑回归的学习，我们已经掌握了构建强大预测模型的基础。现在，我们将进入一个更高级、更强大的算法领域：神经网络（Neural Networks），以及决策树等。

神经网络（NN）是一类算法，其最初的灵感来源于对生物大脑工作方式的模仿。

它并非一个全新的概念，早在20世纪80年代和90年代初就已被使用。但由于当时计算能力和数据量的限制，它在90年代后期一度失宠。然而，自2005年左右以来，得益于大数据和计算能力的飞速发展，神经网络迎来了巨大的复兴，并迅速在语音、图像、自然语言处理（NLP）等众多领域取得了突破性进展。

在大脑中，神经元（Neuron）是基本的信息处理单元。它通过树突（Dendrites）接收输入信号，处理后通过轴突（Axon）产生输出信号。

人工神经网络就是对这个过程的一个简化数学建模。我们将一个生物神经元抽象成一个接收数字输入、进行计算、然后输出一个数字的数学单元。

神经网络的再度崛起，主要得益于两个关键因素的结合：海量的可用数据（大数据） 和 强大的计算能力（更快的处理器，特别是GPU）。

上图清晰地展示了，当数据量非常大时，大型神经网络（绿色曲线）的性能远超传统的机器学习算法（红色曲线）。数据越多，模型越大，性能就越强。

我们其实已经接触过最简单的神经元了------它本质上就是一个我们前面学过的逻辑回归单元。

这个"神经元"接收输入 x（例如商品价格），通过一个 激活函数（activation function） （这里是Sigmoid函数），计算并输出一个 激活值（activation） a，这个 a 值代表了某个事件发生的概率（例如，商品成为爆款的概率）。

神经网络的强大之处在于，它将许许多多这样的单个神经元，组织成一个个"层（Layer）"。

一个典型的神经网络由三部分组成：

输入层 (Input Layer) ：接收原始的特征数据 x⃗（如价格、运费、营销投入等）。
隐藏层 (Hidden Layer)：位于输入层和输出层之间，负责进行大部分的计算。隐藏层能够学习到数据中更抽象、更深层次的特征（如"性价比"、"品牌知名度"等）。
输出层 (Output Layer) ：输出最终的预测结果 a。

当一个网络包含多个隐藏层时，它也被称为多层感知机（Multilayer Perceptron, MLP） 。我们可以通过增加隐藏层的数量和每层神经元的数量，来构建更加复杂的神经网络架构（architecture）。