9.25 深度学习7

定义：将不同的图像划分到不同的类别标签，以实现最小的分类误差。

分类层次：分为通用的多类别图像分类、子类细粒度图像分类和实例级图片分类三个层次。

混淆矩阵：包含TP（真正例）、FP（假正例）、TN（真反例）和FN（假反例）四个基本元素。

精确率（Accuracy）：模型识别正确的个数与样本总个数的比值，是常用的分类性能指标。

准确率（Precision）：在模型识别为正类的样本中，真正为正类的样本所占的比例。

召回率（Recall）：模型正确识别出为正类的样本数量占总的正类样本数量的比值。

精确率与召回率存在权衡关系，互为竞争性指标。

F1-score通过调和平均数融合精确率和召回率，提供一个综合性的模型性能指标。

PR曲线（Precision-Recall Curve）将横坐标设为召回率，纵坐标设为精确率，用于评估模型在各类召回水平下的表现。

ROC曲线（Receiver Operating Characteristic Curve），使用正例与负例比例（FPR）衡量，不受样本不均衡的影响，对于数据分布极度不均衡的场景更具优势。

对于k分类问题，混淆矩阵为k*k的矩阵，主对角线的元素之和为正确分类的样本数，其余元素之和为错误分类的样本数，对角线的值越大，分类器准确率越高。

模型深度：指的是从输入到输出路径上的卷积层和全连接层的数量总和（最长路径的卷积层+全连接层数量），不包含池化层和激活函数。

模型宽度：指的是网络中每一层的特征通道数量。以卷积网络层计算，如LeNet网络的C1有6个通道，C3有16个通道。

样本量过少：当面对如工业质检、医疗诊断这类样本稀缺的场景时，可采用预训练模型迁移学习或数据增强策略来提升模型性能。

解决方案：

迁移学习：使用预训练模型，如利用ImageNet数据集进行预训练，可加速模型收敛。

有监督方法：包括平移、翻转、亮度调整、对比度调整、裁剪、缩放等。

无监督方法：通过GAN网络生成所需样本，然后再进行训练。