9.25 深度学习7

1.图像分类概述

定义:将不同的图像划分到不同的类别标签,以实现最小的分类误差。

分类层次:分为通用的多类别图像分类、子类细粒度图像分类和实例级图片分类三个层次。

2.模型评估核心指标:精确率与召回率

混淆矩阵:包含TP(真正例)、FP(假正例)、TN(真反例)和FN(假反例)四个基本元素。

精确率(Accuracy):模型识别正确的个数与样本总个数的比值,是常用的分类性能指标。

准确率(Precision):在模型识别为正类的样本中,真正为正类的样本所占的比例。

召回率(Recall):模型正确识别出为正类的样本数量占总的正类样本数量的比值。

精确率与召回率存在权衡关系,互为竞争性指标。

3.F1-score和ROC/PR曲线

F1-score通过调和平均数融合精确率和召回率,提供一个综合性的模型性能指标。

PR曲线(Precision-Recall Curve)将横坐标设为召回率,纵坐标设为精确率,用于评估模型在各类召回水平下的表现。

ROC曲线(Receiver Operating Characteristic Curve),使用正例与负例比例(FPR)衡量,不受样本不均衡的影响,对于数据分布极度不均衡的场景更具优势。

4.多分类评估

对于k分类问题,混淆矩阵为k*k的矩阵,主对角线的元素之和为正确分类的样本数,其余元素之和为错误分类的样本数,对角线的值越大,分类器准确率越高。

5.模型参数与超少样本数据处理

模型深度: 指的是从输入到输出路径上的卷积层和全连接层的数量总和(最长路径的卷积层+全连接层数量),不包含池化层和激活函数。

模型宽度: 指的是网络中每一层的特征通道数量。以卷积网络层计算,如LeNet网络的C1有6个通道,C3有16个通道。

样本量过少: 当面对如工业质检、医疗诊断这类样本稀缺的场景时,可采用预训练模型迁移学习或数据增强策略来提升模型性能。

解决方案

迁移学习:使用预训练模型,如利用ImageNet数据集进行预训练,可加速模型收敛。

有监督方法:包括平移、翻转、亮度调整、对比度调整、裁剪、缩放等。

无监督方法:通过GAN网络生成所需样本,然后再进行训练。

相关推荐
鲸鱼24012 小时前
Pytorch工具箱2
人工智能·pytorch·python
西猫雷婶2 小时前
python学智能算法(三十九)|使用PyTorch模块的normal()函数绘制正态分布函数图
开发语言·人工智能·pytorch·python·深度学习·神经网络·学习
zezexihaha2 小时前
AI 在医疗领域的十大应用:从疾病预测到手术机器人
人工智能·机器人
风亦辰7393 小时前
深度学习初探:神经网络的基本结构
人工智能·深度学习·神经网络
MoRanzhi12033 小时前
9. NumPy 线性代数:矩阵运算与科学计算基础
人工智能·python·线性代数·算法·机器学习·矩阵·numpy
WangYan20223 小时前
Transformer模型/注意力机制/目标检测/语义分割/图神经网络/强化学习/生成式模型/自监督学习/物理信息神经网络等
人工智能·深度学习·transformer
金井PRATHAMA3 小时前
GraphRAG:引领自然语言处理进入深层语义分析新纪元
人工智能·自然语言处理·知识图谱
拓端研究室3 小时前
专题:2025年AI Agent智能体行业洞察报告|附110+份报告PDF、数据仪表盘汇总下载
人工智能