深度学习--BP神经网络&梯度下降&损失函数

一、深度学习的介绍

深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向。是一种人工智能的子领域，它基于人工神经网络的概念和结构，通过模拟人脑的工作方式来进行机器学习。深度学习的主要特点是使用多层次的神经网络来提取和学习数据中的特征，并通过反向传播算法来优化网络参数，从而实现对复杂数据的建模与分类。深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成果，并被广泛应用于各种领域。

神经网络是一种由多个神经元（或称为节点）组成的计算模型，它模拟了生物神经系统中神经元之间的连接方式。神经网络有输入层、隐藏层和输出层组成，其中输入层用于接收外界的输入信号，输出层用于输出预测结果，隐藏层则用于处理输入信号并产生中间结果。

1、神经网络构造

神经元1为输入层，而外部传入的x1、x2、x3、x4、x5、......全部都是外界即将传入神经元的电信号，这些电信号在传入途中可能会有所损耗，而损耗完剩下的才会传入神经元，这些传入的实际信号就用w1x1、w2x2、w3x3、w4x4、w5x5、......来表示，w叫做权重。

神经网络：每个节点代表一种特定的是由大量的节点（或称"神经元"）和之间相互的联接构成。

输出函数：称为激励函数、激活函数（activation function）。

每两个节点间的联接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。

推导

需要记忆：

1、设计一个神经网络时，输入层与输出层的节点数往往是固定的，中间层则可以自由指定；

2、神经网络结构图中的拓扑与箭头代表着预测过程时数据的流向，跟训练时的数据流有一定的区别；

3、结构图里的关键不是圆圈（代表"神经元"），而是连接线（代表"神经元"之间的连接）。每个连接线对应一个不同的权重（其值称为权值），这是需要训练得到的。

中间层该如何确定

输入层的节点数：与特征的维度匹配

输出层的节点数：与目标的维度匹配。

中间层的节点数：目前业界没有完善的理论来指导这个决策。一般是根据经验来设置。较好的方法就是预先设定几个可选值，通过切换这几个值来看整个模型的预测效果，选择效果最好的值作为最终选择。

2、感知器

由两层神经元组成的神经网络--"感知器"（Perceptron）,感知器只能线性划分数据。

公式是线性代数方程组，因此可以用矩阵乘法来表达这两个公式

输出的结果与训练集标签进行损失函数计算，与逻辑回归基本一致。

神经网络的本质：通过参数与激活函数来拟合特征与目标之间的真实函数关系。但在一个神经网络的程序中，不需要神经元和线，本质上是矩阵的运算，实现一个神经网络最需要的是线性代数库。

3.多层感知器

增加了一个中间层。即隐含层，它是神经网络可以做非线性分类的关键

假设我们的预测目标是一个向量，那么与前面类似，只需要在"输出层"再增加节点即可。

偏置

在神经网络中需要默认增加偏置神经元（节点），这些节点是默认存在的。它本质上是一个只含有存储功能，且存储值永远为1的单元。在神经网络的每个层次中，除了输出层以外，都会含有这样一个偏置单元。

偏置节点没有输入（前一层中没有箭头指向它）。一般情况下，我们都不会明确画出偏置节点

4、训练方法-损失函数

模型训练的目的：使得参数尽可能的与真实的模型逼近。

具体做法：

1、首先给所有参数赋上随机值。我们使用这些随机生成的参数值，来预测训练数据中的样本。 2、计算预测值为yi，真实值为y。那么，定义一个损失值loss，损失值用于判断预测的结果和真实值的误差，误差越小越好。

常用的损失函数：

1.0-1损失函数

🔹 公式