pytorch fasterrcnn-resnet50-fpn 神经网络 目标识别 应用 —— 逻辑概述

pytorch fasterrcnn-resnet50-fpn 神经网络 目标识别 应用 ------ 逻辑概述

记录神经网络学习过程,我的代码主要参照官方案例:pytorh

有兴趣可以看一下

前提:工欲善其事必先利其器

  1. 工具
  2. 环境(我的环境配置文件 requirements.txt 已上传到 gitee 供大家参考)
  3. 代码
  4. 数据

网上案例很多,环境搭建不再赘述,代码和数据我会上传到gitee

工具看个人喜好,vscode轻便,pycharm 功能好,新手推荐pycharm

源码:https://gitee.com/laomaogu/fasterrcnn_resnet50_fpn_study


接下来正式进入学习环节

一、逻辑概述

对于一个完全陌生的技术点

我一贯的作风是,先搞清楚大概的运行逻辑

细枝末节先不管,这样才能摸清主干的脉络

等到大概搞清楚啥意思了,再逐一深入探讨

毕竟 , 重在 应用

今天先看看最粗的一个枝干
模型训练 推理 识别

够不够简单粗暴,总共就两个东西

1 模型训练

1) 训练数据

正式讲解之前,我们先看一个小故事

厂里生产的水杯最近质量严重下降,导致很多客户投诉

_

老板想找个人,守在产线出口,监督生产

_

招个人干他不放心,这可关乎到厂子生产的质量的问题

_

左思右想,叫来了自家大侄子

_

老板拉着大侄子,到一堆水杯面前,

跟他说:"你看,这个漏水,不行。 这个掉漆,不行。这个可以,里外干净光滑。。。。。"

_

"以后,质量大关,我可就交给你了,好好干,副厂长的位置给你留着"


言归正传,

为啥要训练模型?

本质上就和上边老板对大侄子说的话一样,

要让大侄子明白,哪个是良品,哪个是不良品。

那数据是啥?

显而易见,那堆杯子就是数据,

而且要有好的和不良的杯子做对比, 有了参照,大侄子就明白了


反应到神经网络里,就是以下的过程:
交给 生成 数据 神经网络不断学习 权重文件 xxx.pth

这个权重文件,就是一个"判断标准"

模型和网络结构就像大侄子 ,而训练出来的权重文件就像大侄子的判断标准

至于这个判断标准效果怎么样,只有推理预测一下,才能知道


2) 网络结构

本代码用的结构如标题所述:fasterrcnn-resnet50-fpn

网络结构先不讲,这部分,我们只要知道不同的网络结构的特性及应用方向就OK了

(当然,主要是太深的我也不懂。。。。)


2 推理识别

上面说了

大侄子就是模型,大侄子判断标准就是训练得到的权重文件 .pth.

但是代码不像人

能完成很多高级指令

所以有些过程需要通过代码体现:
输出 加载模型结构 神经网络 加载权重文件 预 测 待推理数据 推理结果


下一章 推理识别代码讲解开源

相关推荐
点云SLAM22 分钟前
CVPR 2024 人脸方向总汇(人脸识别、头像重建、人脸合成和3D头像等)
深度学习·计算机视觉·人脸识别·3d人脸·头像重建
笔触狂放1 小时前
第一章 语音识别概述
人工智能·python·机器学习·语音识别
ZzYH221 小时前
文献阅读 250125-Accurate predictions on small data with a tabular foundation model
人工智能·笔记·深度学习·机器学习
小炫y1 小时前
IBM 后端开发(二)
python
FL16238631292 小时前
汽车表面划痕刮伤检测数据集VOC+YOLO格式1221张1类别
深度学习·yolo·汽车
胡耀超2 小时前
13.快速构建领域知识库的完整指南:结合 ChatGPT 与 Python 提升效率
开发语言·python·chatgpt·知识图谱·知识库
种花生的图图3 小时前
《边界感知的分而治之方法:基于扩散模型的无监督阴影去除解决方案》学习笔记
人工智能·笔记·深度学习·学习·机器学习
CodeClimb3 小时前
【华为OD-E卷 - VLAN资源池 100分(python、java、c++、js、c)】
java·javascript·c++·python·华为od
就叫你天选之人啦4 小时前
PyTorch张量操作reshape view permute transpose
人工智能·pytorch·python
金融OG4 小时前
99.17 金融难点通俗解释:归母净利润
大数据·数据库·python·机器学习·金融