第二章 深度学习之yolov8图像分割输出


文章目录


前言

本章介绍一下yolov8图像分割模型输入输出参数含义,增加自己的记忆


一、模型输入输出样例

bash 复制代码
Input:
	(1x3x1024x1024)
Output0:
	(1x32x256x256)
Output1:
	(1x54x21504)

二、详解

1.Input

1: 输入图像的张数
3: 输入图像的通道数量RGB
1024x1024: 输入图像的分辨率

2.Output0

1: 输出图像的张数
32:
256x256:

3.Output1

1: 输出图像的张数
54: 4(预测框xywh)+18(每个类别的置信度)+32(对应Output0的32)
21504: yolo分割的时候会将输入图像划分为3个尺度(8、16、32)的网格,每个尺度下的网格数量为128128、6464、32*32,加在一起为21504个网格对象

相关推荐
胡耀超7 小时前
DataOceanAI Dolphin(ffmpeg音频转化教程) 多语言(中国方言)语音识别系统部署与应用指南
python·深度学习·ffmpeg·音视频·语音识别·多模态·asr
HUIMU_8 小时前
DAY12&DAY13-新世纪DL(Deeplearning/深度学习)战士:破(改善神经网络)1
人工智能·深度学习
mit6.8249 小时前
[1Prompt1Story] 注意力机制增强 IPCA | 去噪神经网络 UNet | U型架构分步去噪
人工智能·深度学习·神经网络
Coovally AI模型快速验证9 小时前
YOLO、DarkNet和深度学习如何让自动驾驶看得清?
深度学习·算法·yolo·cnn·自动驾驶·transformer·无人机
科大饭桶10 小时前
昇腾AI自学Day2-- 深度学习基础工具与数学
人工智能·pytorch·python·深度学习·numpy
努力还债的学术吗喽10 小时前
2021 IEEE【论文精读】用GAN让音频隐写术骗过AI检测器 - 对抗深度学习的音频信息隐藏
人工智能·深度学习·生成对抗网络·密码学·音频·gan·隐写
weixin_5079299112 小时前
第G7周:Semi-Supervised GAN 理论与实战
人工智能·pytorch·深度学习
AI波克布林14 小时前
发文暴论!线性注意力is all you need!
人工智能·深度学习·神经网络·机器学习·注意力机制·线性注意力
Blossom.11814 小时前
把 AI 推理塞进「 8 位 MCU 」——0.5 KB RAM 跑通关键词唤醒的魔幻之旅
人工智能·笔记·单片机·嵌入式硬件·深度学习·机器学习·搜索引擎
2502_9271612816 小时前
DAY 40 训练和测试的规范写法
人工智能·深度学习·机器学习