9.25 深度学习7

1.图像分类概述

定义:将不同的图像划分到不同的类别标签,以实现最小的分类误差。

分类层次:分为通用的多类别图像分类、子类细粒度图像分类和实例级图片分类三个层次。

2.模型评估核心指标:精确率与召回率

混淆矩阵:包含TP(真正例)、FP(假正例)、TN(真反例)和FN(假反例)四个基本元素。

精确率(Accuracy):模型识别正确的个数与样本总个数的比值,是常用的分类性能指标。

准确率(Precision):在模型识别为正类的样本中,真正为正类的样本所占的比例。

召回率(Recall):模型正确识别出为正类的样本数量占总的正类样本数量的比值。

精确率与召回率存在权衡关系,互为竞争性指标。

3.F1-score和ROC/PR曲线

F1-score通过调和平均数融合精确率和召回率,提供一个综合性的模型性能指标。

PR曲线(Precision-Recall Curve)将横坐标设为召回率,纵坐标设为精确率,用于评估模型在各类召回水平下的表现。

ROC曲线(Receiver Operating Characteristic Curve),使用正例与负例比例(FPR)衡量,不受样本不均衡的影响,对于数据分布极度不均衡的场景更具优势。

4.多分类评估

对于k分类问题,混淆矩阵为k*k的矩阵,主对角线的元素之和为正确分类的样本数,其余元素之和为错误分类的样本数,对角线的值越大,分类器准确率越高。

5.模型参数与超少样本数据处理

模型深度: 指的是从输入到输出路径上的卷积层和全连接层的数量总和(最长路径的卷积层+全连接层数量),不包含池化层和激活函数。

模型宽度: 指的是网络中每一层的特征通道数量。以卷积网络层计算,如LeNet网络的C1有6个通道,C3有16个通道。

样本量过少: 当面对如工业质检、医疗诊断这类样本稀缺的场景时,可采用预训练模型迁移学习或数据增强策略来提升模型性能。

解决方案

迁移学习:使用预训练模型,如利用ImageNet数据集进行预训练,可加速模型收敛。

有监督方法:包括平移、翻转、亮度调整、对比度调整、裁剪、缩放等。

无监督方法:通过GAN网络生成所需样本,然后再进行训练。

相关推荐
冬奇Lab6 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab7 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
吴佳浩8 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒8 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海9 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠9 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao9 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理
Lihua奏10 小时前
从单核到多核:CPU为什么不能再只靠提频变快
深度学习
程序员cxuan10 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员