动手学习深度学习学习笔记（一）

一，一些基本的概念

数据集，模型，样本

在苹果手机中我们可以通过hey siri了唤醒其中的AI siri，这一过程是通过事先的训练所得到的。训练的过程就是我们先搞到一个网络的框架（就是模型），然后我们通过向框架输入一些数据来调整参数（这个模型框架自带的一些随机的初始参数），直到这个框架能够稳定准确地识别hey siri为止。（这些数据加在一起被称作数据集，每一个数据都是一个样本）

一个样本中有属性和其相对应的数值，那些音频信息，有音量，音色等属性，但是计算机看不懂，所以我们要通过将这些属性变成数值来使计算机明白这些属性（音量是大是小，语速是快是慢）

独立同分布

在深度学习中，样本是遵循独立同分布的。独立指的是每个样本是相互独立互不影响的，同分布是指每个样本的是由同一种规律的。举个例子，在训练siri时，我们会给他大量的音频，这些音频可能是女生录制的，也可能是男生录制的，可能是老年人，也可能是年轻人，可能在一个安静的环境，也可能是在一个嘈杂的环境，但是这些音频的内容都是hey siri 。

监督学习

监督学习就是在训练AI 的时候给他不同的音频，有的是hey siri，有的不是hey siri，最开始会人为的打上一些标签（又叫目标），告诉AI 这个音频是hey siri 这段音频不是hey siri 。训练结束后，AI就能够自主的为收到的音频打上标签，并给出相应的反馈。

维度

当我们每一个样本的特殊数量都相同的时候，那么样本特征向量的长度就是固定的，这个固定的长度就是维度。比如说我们在给AI音频的时候，我们发的每一个音频只取其中的三个特征：音量，语速，音频，那么这个样本的维度就是三。（只有在特征的数量都相同的情况下才存在唯独这个概念）

预先假设

就是对AI进行训练前，我们先对这个AI的框架进行一个假设，然后给AI 大量的数据进行训练，通过训练得到这个框架的拟合效果，从而对框架进行调整和改进。我们有的数据越多对拟合效果的感知就越好，从而可以更好的对框架进行调整。

目标函数

目标函数就是预先设置好的一个函数，他会计算出模型跑出的结果和真实结果的差值（不是减法就是通过运算得到的一个数值），这个数值的值越小模型跑出的结果和真实的结果的差距就越小，模型输出的结果就越正确。目标函数的输出结果是给算法看的。

对目标函数的深度理解与优化代替目标

目标函数可以理解为一种规则，就是我们想要用数据集对AI进行训练，在训练的过程中我们要让AI明白训练的效果，并对自身的参数进行调整，目标函数就是起到一个让AI明白训练效果的作用。为了让AI能够清晰地知道训练的效果，我们需要对目标函数进行优化，从而让她能够准确地对训练效果做出评估。那么，在对目标函数进行优化的时，有的目标函数难以被优化，这时我们要优替代目标，就是换一种角度对效果进行评估，从而达到预想的效果。（优化目标函数更专业的来讲就是最小化目标函数）

梯度下降

梯度下降（Gradient Descent）是一种迭代式的一阶优化算法，用于最小化目标函数。

它的核心思想是：沿着目标函数关于参数的负梯度方向 **，迭代更新模型参数，使目标函数值逐步下降，最终收敛到局部最小值。就是告诉模型应该向哪里去调整，怎样调整参数从而更好的拟合。

二，监督学习，无监督学习

监督学习

标准性的定义：监督学习是机器学习的核心范式之一，其核心是利用带标签的标注数据集进行模型训练。该数据集由若干个特征 - 标签样本对组成，其中特征为模型的输入变量，标签为需要预测的目标输出变量。模型通过学习特征空间与标签空间之间的映射关系，构建预测模型，最终实现对未标注的新特征样本进行标签预测的任务，常见任务包括分类、回归等。

通俗性的讲解：监督学习就是我们给模型大量的数据（就是特征），并给模型与特征相应的标签（就比如我们给模型一堆小猫的图片，并告诉模型这些图片就是小猫。这个例子里面图片就相当于特征，告诉模型这个图片是小猫就是标签）

什么是范式：机器学习范式是机器学习领域的核心方法论体系，其本质是对特定学习任务的抽象化定义，统一规定了数据的表示方式（如特征、标签、样本组织形式）、模型的学习目标（如拟合映射关系、挖掘分布规律、优化决策策略）、训练数据的构成与预测逻辑。基于统一的机器学习范式，可选用适配的算法构建模型，并通过训练数据优化模型参数，最终实现对未知数据的推理、预测或生成。

回归与分类

回归的标准定义:回归是一种预测性建模技术，用于预测连续的、数值型的目标变量。它的核心目标是理解自变量(输入特征)和因变量(输出目标)之间的关系，并拟合出一条能够最小化预测

误差的数学曲线或曲面。

核心特点:结果是一个具体的数值，可以有无限种可能的大小，且数值之间存在大小和距离的

比较意义（数据之间存在大小和距离的比较意义就是数学曲线或曲面中的数值以及它的差值，可以反映出现实生活中的一些真实的差异或者结果）

分类的标准定义：分类是一种预测性建模技术，用于将输入数据划分到离散的、预先定义的类别(标签)中。它的核心目标是寻找一个最佳的"决策边界"，以便将不同类别的数据尽可能准确地隔离开来。

核心特点：结果是一个非数值型的类别标签

通俗点的讲：分别的主要任务就是区分什么是什么，而回归的主要任务是得到与真实数据最相近的数值。

无监督学习

无监督学习是机器学习中处理无标签数据的核心方法，它不依赖人工标注，依靠算法自主挖掘数据规律，是从海量原始数据中提取价值的关键技术。