YOLO11改进-模块-引入星型运算Star Blocks

当前网络设计中,"星型运算"(逐元素乘法)的应用原理未被充分探究,潜力有待挖掘。为解决此问题,我们引入 Star Blocks,其内部由 DW - Conv、BN、ReLU 等模块经星型运算连接,各模块有特定参数。同时揭示星型运算可将输入映射到高维非线性特征空间且无需拓宽网络。最终 StarNet 在紧凑结构和高效预算下实现了高性能与低延迟,有效提升了网络性能。本文考虑到YOLO目标检测的C3k2模块在特征融合的时候,高维非线性特征缺失,本文将Star Blocks与C3K2相结合,提出 C3k2_StarsBlock模块。

左边是原模型,右边是改进模型

1. 星型运算Star Blocks结构介绍

1. 卷积层(Conv):模块中包含卷积层,用于提取特征。不同阶段(stage)的卷积层有不同的参数。例如,图中提到卷积层(Conv)的核大小(ks)为 3,步长(stride)为 2。

2. 深度可分离卷积(DW - Conv):模块中还包含深度可分离卷积层,用于进一步处理特征。深度可分离卷积层的核大小(ks)为 7,步长(stride)为 1。

3. 批量归一化(BN)和激活函数(ReLU):在模块中,深度可分离卷积层前后可能会有批量归一化和激活函数操作,用于归一化数据和引入非线性。

4. 星型运算(element - wise mul.,即星型乘法):这是 Star Blocks 模块的关键操作。星型运算将不同层的特征进行逐元素乘法,从而在不增加网络宽度的情况下,将输入映射到高维非线性特征空间。

2. YOLOv11与星型运算Star Blocks的结合

  1. YOLO目标检测的C3k2模块在特征融合的时候,存在高维非线性特征缺失,本文将Star Blocks与C3K2相结合,提出C3k2_StarsBlock模块。

3. 星型运算Star Blocks代码部分

YOLOv8_improve/YOLOv11.md at master · tgf123/YOLOv8_improve

4. 将星型运算Star Blocks引入到YOLOv11中

第一: 将下面的核心代码复制到D:\model\yolov11\ultralytics\change_model路径下,如下图所示。

第二:在task.py中导入C3k2_StarsBlock包

第三:在task.py中的模型配置部分下面代码

​​​​​​

第四:将模型配置文件复制到YOLOV11.YAMY文件中

第五:运行成功

python 复制代码
from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld

if __name__=="__main__":

    # 使用自己的YOLOv8.yamy文件搭建模型并加载预训练权重训练模型
    model = YOLO(r"D:\model\yolov11\ultralytics\cfg\models\11\yolo11_starnet.yaml")\
        .load(r'D:\model\yolov11\yolo11n.pt')  # build from YAML and transfer weights

    results = model.train(data=r'D:\model\yolov11\ultralytics\cfg\datasets\VOC_my.yaml',
                          epochs=300,
                          imgsz=640,
                          batch=64,
                          # cache = False,
                          # single_cls = False,  # 是否是单类别检测
                          # workers = 0,
                         # resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
                         #  amp = True
                          )
相关推荐
Diros1g20 小时前
如何通过普通网线给另一个设备供网
网络·网络协议
beyond阿亮20 小时前
IEC104 Client Simulator - IEC104 主站/客户端模拟器 仿真器免费使用教程
运维·服务器·网络
(Charon)21 小时前
【C++/Qt】Qt 封装 TCP 客户端底层 Network 类:连接、收发、自动测试与错误处理
服务器·网络·qt·tcp/ip
KKKlucifer21 小时前
日志审计与行为分析在安全服务中的应用实践
网络·人工智能·安全
Aray123421 小时前
浅析内网跨网段连通差异:ICMP不可达与静默丢包底层原理拆解
网络·ping
Unbelievabletobe21 小时前
港股api的WebSocket推送如何订阅多只股票
网络·websocket·网络协议
TechWayfarer1 天前
IP归属地运营商能解决什么问题?风控/增长/数据平台落地实践(附API代码)
开发语言·网络·python·网络协议·tcp/ip
Leon_Chenl1 天前
【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统
深度学习·opencv·yolo·ffmpeg·音视频·边缘计算·人脸识别+检测
TechWayfarer1 天前
IP归属地运营商生产落地进阶:缓存+降级+灰度对账全解析
网络·python·网络协议·tcp/ip·缓存
funnycoffee1231 天前
华为USG防火墙修改tcp aging time , default is 1200S
网络·网络协议·tcp/ip·usg aging time