YOLO26 改进、魔改| 空间-通道特征调制器SCFM,通过空间与通道双维度注意力调制,融合全局与局部特征,提升视觉任务的特征质量与模型效果。

当前超高清图像复原任务中,传统逐像素处理的视觉模型计算成本极高,即便采用聚类中心的稀疏建模方式大幅压缩计算量,也会在特征聚合过程中不可避免地丢失图像边缘、纹理、细微结构等高频细节信息,导致模型只具备全局语义理解能力,却缺失局部精细特征支撑。为了破解高效建模与细节保留无法兼顾的行业难题,SCFM 被设计为专用的特征优化模块,以轻量化机制完成细节修复与特征补强。
基础模型
改进后的模型

1.SCFM原理

SCFM 采用空间与通道双向独立调制、特征互补融合的核心原理,通过双分支注意力机制对特征进行精细化优化。空间分支聚焦图像的位置分布与局部结构,精准找回聚类建模中损耗的空间细节;通道分支挖掘不同特征通道的语义贡献度,强化有效特征、抑制冗余信息。二者协同工作,在不增加过多计算负担的前提下,将全局聚类特征与局部细节特征完美整合,让特征表达更全面、更精准。

SCFM 采用极简的并行双分支架构,部署灵活、计算高效,整体分为三个功能单元:

  1. 空间调制单元:对输入特征做空间维度的最大与平均池化,拼接后通过卷积与激活函数生成空间权重,重点增强图像关键区域的细节特征。

  2. 通道调制单元:先对特征做轻量卷积变换,再通过通道维度的池化与激活生成通道权重,筛选出对任务有价值的核心特征通道。

  3. 特征融合单元:将空间、通道调制后的特征分别与原始特征加权,最终融合输出完整的优化特征。

2. YOLO与 SCFM的结合

SCFM 轻量化的设计不会增加 YOLO 模型的参数量和推理时间,完全契合 YOLO 实时检测的应用需求。它能有效弥补 YOLO 在特征提取阶段的细节损耗,强化目标特征的表达效果,让小目标、复杂背景下的检测结果更稳定可靠。

3. SCFM代码部分

YOLO11|YOLO12|YOLO26|改进| 空间 - 通道特征调制器SCFM,通过空间与通道双分支注意力协同调节,融合全局与局部特征,弥补丢失细节_哔哩哔哩_bilibili

YOLO26 杀疯了:性能 Double + 无 NMS/DFL,更快更强更轻量的检测「新爹」_哔哩哔哩_bilibili

YOLOv11模型改进讲解,教您如何修改YOLOv11_哔哩哔哩_bilibili

代码获取: YOLOv8_improve/YOLOV12.md at master · tgf123/YOLOv8_improve · GitHub

4. SCFM引入到YOLO26中

第一: 先新建一个change_model,如下图如所示。

将代码复制到change_model里面

​​​​​​​

第二:在task.py中导入

​​​ ​​​​​​​

第三:在task.py中的模型配置部分下面代码

​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​ ​​​​​​​​​​​​​​​​​​​​​

第四:将模型配置文件复制到YOLOV11.YAMY文件中

​​​​​​​​​​​​​​​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​ ​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​​

​​​​​​​ ​​​​​​​​​​​​​​ ​​​​​​​ ​​​​​​​​​​​​​第五:运行代码

python 复制代码
from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorld

if __name__=="__main__":

    # 使用自己的YOLOv12.yamy文件搭建模型并加载预训练权重训练模型
    model = YOLO(r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/models/26/yolo26_SCFM.yaml")
        # .load(r'E:\Part_time_job_orders\YOLO_NEW\YOLOv12\yolo12n.pt')  # build from YAML and transfer weights

    results = model.train(data=r"/home/tgf/tgf/yolo/model/YOLO26/ultralytics/cfg/datasets/VOC_my.yaml",
                          epochs=300,
                          imgsz=640,
                          batch=32,
                          optimizer="MuSGD",
                          # cache = False,
                          # single_cls = False,  # 是否是单类别检测
                          # workers = 0,
                         # resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',
                          amp = True
                          )
相关推荐
shao91851614 小时前
第12章Streaming(下):视频应用(1)——项目八:基于WebRTC+YOLO的实时目标检测
yolo·目标检测·webrtc·gradio·视频流·yolov10·流式传输
Uopiasd1234oo1 天前
上下文引导模块改进YOLOv26局部与全局特征融合能力双重提升
深度学习·yolo·机器学习
懷淰メ1 天前
【AI加持】基于PyQt+YOLO+DeepSeek的钢材焊接缺陷检测系统(详细介绍)
yolo·目标检测·计算机视觉·pyqt·缺陷检测·deepseek·钢材缺陷
动物园猫1 天前
工业织物缺陷目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
迪菲赫尔曼1 天前
从 0 到 1 打造工业级推理控制台:UltraConsole(Ultralytics + FastAPI + React)开源啦!
前端·yolo·react.js·计算机视觉·开源·fastapi
极智视界1 天前
分类数据集 - 遥感航空影像云量检测图像分类数据集下载
yolo·数据集·图像分类·算法训练·遥感航空影像云量检测
极智视界1 天前
分类数据集 - 伪造人脸和真实人脸分类数据集下载
人工智能·yolo·数据集·图像分类·算法训练·人脸伪造检测
qq762118221 天前
windows 训练yolov26官方数据集
yolo26
深度学习lover2 天前
<数据集>yolo 常见对象检测<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·常见对象检测
Westward-sun.2 天前
YOLOv2算法全方位解析:从BatchNorm到聚类先验框的九大改进
算法·yolo·聚类