感谢来自b站up主:我喜欢吃小熊饼干 的知识分享
一、了解大致概念
1、方向:
【深度学习】中的------【计算机视觉方向】
2、过程要干什么
把网上的大量的现有数据集------> 经过我们写得代码训练成模型------> 之后的任意测试数据都可被这模型输出我们要的结果
3、任务分类
1)目标检测类型模型
2)分类类型模型
3)图像分割(语义分割)类型模型
4、其他概念
二、深度学习细解
1、我们需要手动把数据集分类
2、损失函数和优化器
3、迁移学习
4、我们要做的整体一个过程
提示
我后期做的项目会直接用我之前学的vue+springboot这种前后端系统来演示,但是专注研究算法没学过前后端的就不用了,这方面你直接用HTML页面展示都完全足够了
三、目标检测细解
1、两种分类(我们要学的是第一种:YOLO)
2、细化流程

1)数据集获取方式
2)数据标注
手动写代码把大量数据整理成各个类别、名称,好方便计算机读取时认得出谁是谁
3)初始数据集结构
你的数据集文件在文件夹里要怎么排布?
标注文件是用XML文件、还是txt文件?要根据个别情况来
4)数据增强
5)复现模型
6)模型对比分析(评判这模型究竟有多准)
;
4个小术语:
TP正检
TN负检(一般没用)
FP错检
FN漏检
有了TP / FP / FN,就可以计算出Precision、Recall 这两个指标值,也称P值、R值
P曲线、R曲线、AP的含义
mAP、F1的含义
其实说白了AP、mAP、F1.......都是在综合考察【P和R】的指标
7)计算量相关指标
8)实验结果分析(常见图表的含义)
最后把几个模型绘制成一个柱状图和一个图表就够了





























































