9.25 深度学习7

1.图像分类概述

定义:将不同的图像划分到不同的类别标签,以实现最小的分类误差。

分类层次:分为通用的多类别图像分类、子类细粒度图像分类和实例级图片分类三个层次。

2.模型评估核心指标:精确率与召回率

混淆矩阵:包含TP(真正例)、FP(假正例)、TN(真反例)和FN(假反例)四个基本元素。

精确率(Accuracy):模型识别正确的个数与样本总个数的比值,是常用的分类性能指标。

准确率(Precision):在模型识别为正类的样本中,真正为正类的样本所占的比例。

召回率(Recall):模型正确识别出为正类的样本数量占总的正类样本数量的比值。

精确率与召回率存在权衡关系,互为竞争性指标。

3.F1-score和ROC/PR曲线

F1-score通过调和平均数融合精确率和召回率,提供一个综合性的模型性能指标。

PR曲线(Precision-Recall Curve)将横坐标设为召回率,纵坐标设为精确率,用于评估模型在各类召回水平下的表现。

ROC曲线(Receiver Operating Characteristic Curve),使用正例与负例比例(FPR)衡量,不受样本不均衡的影响,对于数据分布极度不均衡的场景更具优势。

4.多分类评估

对于k分类问题,混淆矩阵为k*k的矩阵,主对角线的元素之和为正确分类的样本数,其余元素之和为错误分类的样本数,对角线的值越大,分类器准确率越高。

5.模型参数与超少样本数据处理

模型深度: 指的是从输入到输出路径上的卷积层和全连接层的数量总和(最长路径的卷积层+全连接层数量),不包含池化层和激活函数。

模型宽度: 指的是网络中每一层的特征通道数量。以卷积网络层计算,如LeNet网络的C1有6个通道,C3有16个通道。

样本量过少: 当面对如工业质检、医疗诊断这类样本稀缺的场景时,可采用预训练模型迁移学习或数据增强策略来提升模型性能。

解决方案

迁移学习:使用预训练模型,如利用ImageNet数据集进行预训练,可加速模型收敛。

有监督方法:包括平移、翻转、亮度调整、对比度调整、裁剪、缩放等。

无监督方法:通过GAN网络生成所需样本,然后再进行训练。

相关推荐
Carl_奕然12 分钟前
人工智能的幻觉问题:机理、挑战与缓解策略
人工智能·语言模型
独自归家的兔13 分钟前
通义千问3-VL-Plus - 界面交互(本地图片改进)
java·人工智能·交互
LitchiCheng16 分钟前
Mujoco 使用 Pinocchio 进行逆动力学及阻抗力矩控制维持当前位置
人工智能·python
ZCXZ12385296a17 分钟前
面包类型识别与手部检测系统改进_yolov8-ADown实战
人工智能·yolo·目标跟踪
万里鹏程转瞬至18 分钟前
论文简读:Qwen3-VL Technical Report | Qwen3VL技术报告
论文阅读·深度学习·多模态
undsky_21 分钟前
n8n 重构镜像,开启无限可能
人工智能·ai·aigc·ai编程
北邮刘老师23 分钟前
智能体,超越人类与机器的世界“理解者”
网络·人工智能·大模型·智能体·智能体互联网
paopao_wu25 分钟前
声音克隆与情感合成:Dify接入IndexTTS2
人工智能·ai·tts
会挠头但不秃27 分钟前
深度学习常用工具和库介绍
人工智能·深度学习
Coder_Boy_33 分钟前
【人工智能应用技术】-基础实战-小程序应用(基于springAI+百度语音技术)智能语音控制
人工智能·小程序