yolo11-seg模型后处理输出节点

检测头节点分析总结

1. Bounding Box 头 (cv2) - 回归头部

  • /model.23/cv2.0/cv2.0.2/Conv_output_0: [1, 64, 80, 80]

  • /model.23/cv2.1/cv2.1.2/Conv_output_0: [1, 64, 40, 40]

  • /model.23/cv2.2/cv2.2.2/Conv_output_0: [1, 64, 20, 20]

作用: 输出边界框回归参数,64个通道对应4个坐标×16个DFL(Distribution Focal Loss)bins,用于精确的边界框定位。

2. 分类头 (cv3) - 类别预测头部 7类

  • /model.23/cv3.0/cv3.0.2/Conv_output_0: [1, 7, 80, 80]

  • /model.23/cv3.1/cv3.1.2/Conv_output_0: [1, 7, 40, 40]

  • /model.23/cv3.2/cv3.2.2/Conv_output_0: [1, 7, 20, 20]

作用: 输出7个类别的概率分数,每个空间位置对应7个类别的置信度。

3. 分割头 (cv4) - 掩码系数头部

  • /model.23/cv4.0/cv4.0.2/Conv_output_0: [1, 32, 80, 80]

  • /model.23/cv4.1/cv4.1.2/Conv_output_0: [1, 32, 40, 40]

  • /model.23/cv4.2/cv4.2.2/Conv_output_0: [1, 32, 20, 20]

作用: 输出32个掩码系数,用于生成实例分割掩码,这三个不同尺度的输出会被合并。

数据流向:

  1. cv2和cv3头 → 通过Concat操作合并到最终的output0输出
  • cv2输出经过DFL处理链(Reshape→Transpose→Softmax→Conv→Slice→数学运算)→最终bbox坐标

  • cv3输出经过Sigmoid激活→最终类别概率

  1. cv4头 → 经过Reshape和Concat操作形成掩码系数 → 存储在output0的最后32个通道中

  2. 独立的分割路径 → 通过proto网络分支生成output1

  • 来源:来自主干网络的特征

  • 处理:Conv→ReLU→ConvTranspose(上采样)→Conv→ReLU→Conv→ReLU

  • 输出:[1, 32, 160, 160] → 直接作为output1输出

多尺度检测策略:

  • Scale 0 (大物体): 80×80网格,适合检测较大目标

  • Scale 1 (中物体): 40×40网格,适合检测中等目标

  • Scale 2 (小物体): 20×20网格,适合检测较小目标

特征层 典型输入尺寸(以640×640图为例) 主要任务
P3 [1, 128, 80, 80] 检测小目标(<32×32像素)
P4 [1, 256, 40, 40] 检测中等目标(32--96像素)
P5 [1, 512, 20, 20] 检测大目标(>96像素)

对应的rknn模型图:

相关推荐
qq_452396233 小时前
【AI 架构师】第十篇:Agent 工业化部署 —— 从 FastAPI 到云端全链路监控
网络·人工智能·ai·fastapi
前端摸鱼匠3 小时前
【AI大模型春招面试题11】什么是模型的“涌现能力”(Emergent Ability)?出现条件是什么?
人工智能·算法·ai·自然语言处理·面试·职场和发展
Unknown To Known7 小时前
基于DyHead和YOLOv11的错题自动切分系统
yolo
VIP_CQCRE9 小时前
Recaptcha2 图像识别 API 集成指南
ai
L-影10 小时前
Agent中的ReAct:类型、作用与避坑指南(下篇)
人工智能·ai·react
hongzh010 小时前
OpenClaw:WebSocket shared-auth connections could self-declare elevated scopes
ai·openclaw
腾视科技TENSORTEC10 小时前
腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元
大数据·人工智能·科技·ai·ai算力模组·ai模组·ainas
LilySesy11 小时前
【与AI+】英语day1——ABAP基础与数据类型
开发语言·ai·sap·abap
supersolon11 小时前
Windows环境docker安装OpenClaw
docker·ai·docker-compose·openclaw·龙虾
前端摸鱼匠13 小时前
【AI大模型春招面试题8】词元化(Tokenization)的作用是什么?BPE、WordPiece、Unigram的原理与优缺点?
人工智能·ai·面试·职场和发展·求职招聘