yolov8添加cbam注意力机制

(如果添加的是CBAM,已存在,忽略步骤 1 2 3)

步骤1.创建注意力机制-类

ultralytics/nn/modules/conv.py

步骤2.添加到conv.py文件的头文件里

ultralytics/nn/modules/conv.py

步骤3.添加到 init.py文件的头文件里

ultralytics/nn/modules/init .py


步骤4.tasks.py 中导入

ultralytics/nn/tasks.py

步骤5.tasks.py文件的parse_model函数,修改

在这个文件中,使用文件搜索功能(快捷键Ctrl + F),弹出快捷栏如下->

(错误步骤-不看此步骤-用于记录过程)--我们搜索下面这个代码"parse_model" 然后进行翻滚很容易就找到了下面的部分,同时进行红框内部的修改

(正确步骤)我们搜索下面这个代码"parse_model" 然后进行添加以下代码

python 复制代码
        elif m is CBAM: # todo 源码修改 (增加了elif)
            """
            ch[f]:上一层的
            args[0]:第0个参数
            c1:输入通道数
            c2:输出通道数
            """
            c1, c2 = ch[f], args[0]
            # print("ch[f]:",ch[f])
            # print("args[0]:",args[0])
            # print("args:",args)
            # print("c1:",c1)
            # print("c2:",c2)
            if c2 != nc:  # if c2 not equal to number of classes (i.e. for Classify() output)
                c2 = make_divisible(c2 * width, 8)
            args = [c1, *args[1:]]

步骤6.修改yaml文件进行网络结构的配置

如:ultralytics/cfg/models/v8 目录下的 yolov8.yaml

分析 - 学习网上的更改 (左:原结构;右:更改后的结构)

分析:在c2f层的后面添加了 CBAM层
分析:结构参数的变化

分析 - 自己任务代码的更改 (左:原结构;右:更改后的结构)

分析:在c2f层的后面添加了 CBAM层
分析:结构参数的变化

bug

yolov8训练中keyError报错

把项目中修改后的tasks.py 覆盖 环境配置里面的tasks.py,

或者将加入的注意力机制拷贝过去都可以解决此问题

环境配置里面的tasks.py目录:\anaconda3\envs\torch\Lib\site-packages\ultralytics\nn

参考链接:https://blog.csdn.net/weixin_70423469/article/details/131684931

运行效果

对比图(左:未添加cbam,右:添加cbam)

相关推荐
Csvn15 小时前
🌟 LangChain 30 天保姆级教程 · Day 13|OutputParser 进阶!让 AI 输出自动转为结构化对象,并支持自动重试!
python·langchain
Wenweno0o15 小时前
0基础Go语言Eino框架智能体实战-chatModel
开发语言·后端·golang
chenjingming66615 小时前
jmeter线程组设置以及串行和并行设置
java·开发语言·jmeter
cch891816 小时前
Python主流框架全解析
开发语言·python
不爱吃炸鸡柳16 小时前
C++ STL list 超详细解析:从接口使用到模拟实现
开发语言·c++·list
十五年专注C++开发16 小时前
RTTR: 一款MIT 协议开源的 C++ 运行时反射库
开发语言·c++·反射
Momentary_SixthSense16 小时前
设计模式之工厂模式
java·开发语言·设计模式
sg_knight16 小时前
设计模式实战:状态模式(State)
python·ui·设计模式·状态模式·state
好运的阿财16 小时前
process 工具与子agent管理机制详解
网络·人工智能·python·程序人生·ai编程
‎ദ്ദിᵔ.˛.ᵔ₎16 小时前
STL 栈 队列
开发语言·c++