第二章 深度学习之yolov8图像分割输出


文章目录


前言

本章介绍一下yolov8图像分割模型输入输出参数含义,增加自己的记忆


一、模型输入输出样例

bash 复制代码
Input:
	(1x3x1024x1024)
Output0:
	(1x32x256x256)
Output1:
	(1x54x21504)

二、详解

1.Input

1: 输入图像的张数
3: 输入图像的通道数量RGB
1024x1024: 输入图像的分辨率

2.Output0

1: 输出图像的张数
32:
256x256:

3.Output1

1: 输出图像的张数
54: 4(预测框xywh)+18(每个类别的置信度)+32(对应Output0的32)
21504: yolo分割的时候会将输入图像划分为3个尺度(8、16、32)的网格,每个尺度下的网格数量为128128、6464、32*32,加在一起为21504个网格对象

相关推荐
子午11 分钟前
【野生动物识别系统】Python+深度学习+人工智能+卷积神经网络算法+TensorFlow+ResNet+图像识别
人工智能·python·深度学习
王哈哈^_^1 小时前
【数据集】【YOLO】【目标检测】摔跤识别数据集 5097 张,YOLO行人摔倒识别算法实战训练教程!
人工智能·深度学习·算法·yolo·目标检测·计算机视觉·pyqt
Caesar Zou1 小时前
深度学习⑨GANs
人工智能·深度学习
Thanks_ks2 小时前
利用 TensorFlow 与 Docker 构建深度学习模型训练与部署流水线
深度学习·docker·tensorflow·模型部署·容器化技术·模型训练·flask 应用
存内计算开发者4 小时前
ISSCC 34.9 面向塑性神经网络集片上自学习与推理一体
人工智能·深度学习·神经网络·学习·机器学习·ai·存内计算
zjun30214 小时前
Ascend Extension for PyTorch的源码解析
人工智能·pytorch·python·深度学习·华为
TIANE-Kimmy4 小时前
对比:生成对抗网络(GANs)和变分自编码器(VAEs)
人工智能·深度学习·计算机视觉
听风吹等浪起4 小时前
改进系列(3):基于ResNet网络与CBAM模块融合实现的生活垃圾分类
网络·深度学习·神经网络·分类·生活
计算机科研狗@OUC4 小时前
【TMM2024】Frequency-Guided Spatial Adaptation for Camouflaged Object Detection
人工智能·深度学习·目标检测·计算机视觉
Bearnaise5 小时前
PointMamba: A Simple State Space Model for Point Cloud Analysis——点云论文阅读(10)
论文阅读·笔记·python·深度学习·机器学习·计算机视觉·3d