第二章 深度学习之yolov8图像分割输出


文章目录


前言

本章介绍一下yolov8图像分割模型输入输出参数含义,增加自己的记忆


一、模型输入输出样例

bash 复制代码
Input:
	(1x3x1024x1024)
Output0:
	(1x32x256x256)
Output1:
	(1x54x21504)

二、详解

1.Input

1: 输入图像的张数
3: 输入图像的通道数量RGB
1024x1024: 输入图像的分辨率

2.Output0

1: 输出图像的张数
32:
256x256:

3.Output1

1: 输出图像的张数
54: 4(预测框xywh)+18(每个类别的置信度)+32(对应Output0的32)
21504: yolo分割的时候会将输入图像划分为3个尺度(8、16、32)的网格,每个尺度下的网格数量为128128、6464、32*32,加在一起为21504个网格对象

相关推荐
Mory_Herbert3 小时前
5.1 神经网络: 层和块
人工智能·深度学习·神经网络
知来者逆5 小时前
在与大语言模型交互中的礼貌现象:技术影响、社会行为与文化意义的多维度探讨
人工智能·深度学习·语言模型·自然语言处理·llm
IT猿手6 小时前
基于 Q-learning 的城市场景无人机三维路径规划算法研究,可以自定义地图,提供完整MATLAB代码
深度学习·算法·matlab·无人机·强化学习·qlearning·无人机路径规划
魔障阿Q8 小时前
windows使用bat脚本激活conda环境
人工智能·windows·python·深度学习·conda
shadowtalon10 小时前
基于CNN的猫狗图像分类系统
人工智能·深度学习·神经网络·机器学习·计算机视觉·分类·cnn
蹦蹦跳跳真可爱58910 小时前
Python----神经网络(《Deep Residual Learning for Image Recognition》论文和ResNet网络结构)
人工智能·python·深度学习·神经网络
豆芽81911 小时前
Vision Transformer(ViT)
人工智能·深度学习·目标检测·计算机视觉·transformer
終不似少年遊*12 小时前
MindSpore框架学习项目-ResNet药物分类-模型优化
人工智能·深度学习·机器学习·计算机视觉·分类·数据挖掘·华为云
Code_流苏12 小时前
《Python星球日记》 第55天:迁移学习与预训练模型
python·深度学习·微调·resnet·迁移学习·预训练模型·超参数优化
背太阳的牧羊人12 小时前
SemanticSplitterNodeParser 和 Sentence-BERT 的区别和联系是什么
人工智能·深度学习·bert