【Week-Y4】修改yolov5s中C3模块的结构,common.py文件解读

修改C3模块的结构

如左图,有3个conv模块,需要改为右图,右图只包含2个conv模块。
📕提示:仅需修改./models/common.py文件

📕步骤:

(1)首先找到coomon.py中定义C3模块的地方;

(2)然后将代码与上图的左图对应起来,观察需要改动的位置,结合结构,更容易看懂代码;

(3)找到之后按照要求修改,并运行train.py,看是否能跑通。

./models/common.py中,保存的是v5s各个模块的实现,包括基本模块(如autopad、Conv、Bottleneck、BottleneckCSP、C3、SPP、Concat、Expand和Contract)和重要模块(NMS、AutoShape、Detections、Classify)。

一、commom.py文件解析

yolov5-master的文件结构如下:

python 复制代码
yolov5-master
|-classify
|-data
|-models (本次学习需要的文件在这里面)
	|-hub
	|-segment
	|-common.py(这是本次学习需要修改的文件,文件内容是yolov5s各个模块的定义)
	|-experi,emtal.py
	|-tf.py
	...
|-runs
|-segment
|-utils
...

打开common.py文件,找到定义C3模块的位置:

python 复制代码
class C3(nn.Module):
    # CSP Bottleneck with 3 convolutions
    def __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):
        """Initializes C3 module with options for channel count, bottleneck repetition, shortcut usage, group
        convolutions, and expansion.
        """
        super().__init__()
        c_ = int(c2 * e)  # hidden channels
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c1, c_, 1, 1)
        self.cv3 = Conv(2 * c_, c2, 1)  # optional act=FReLU(c2)
        self.m = nn.Sequential(*(Bottleneck(c_, c_, shortcut, g, e=1.0) for _ in range(n)))

    def forward(self, x):
        """Performs forward propagation using concatenated outputs from two convolutions and a Bottleneck sequence."""
        return self.cv3(torch.cat((self.m(self.cv1(x)), self.cv2(x)), 1))

这一段代码中定义了C3的模块结构,初始化时定义了3个卷积结构,然后在forward函数内部,给出了该模块的返回值,将返回值self.cv3(torch.cat((self.m(self.cv1(x)), self.cv2(x)), 1))拆解,并与给出的C3结构一一对应,得到下图:

由此可知,去掉concat后的卷积只需要将返回值的最外层丢掉即可。

二、修改代码,运行train.py训练

C3模块修改如下:【注释的那行是原来的结构,也就是concat后还经过了conv】

数据集:水果数据集 【使用week Y2的数据集】

命令行:python .\train.py --img 900 --batch 2 --epoch 100 --data .\fruit.yaml --cfg .\models\yolov5s.yaml --weights .\yolov5s.pt --device cpu【与week Y2的训练命令是一样的】

开始训练:

相关推荐
Kobebryant-Manba33 分钟前
学习参数管理
pytorch·python·深度学习
AI人工智能+37 分钟前
药品注册证识别技术利用深度学习和多模态融合架构,实现药品注册证信息的自动化精准提取
深度学习·语言模型·自然语言处理·ocr·药品注册证识别
keykey6.37 分钟前
LSTM 文本情感分析:从词嵌入到分类实战
开发语言·人工智能·深度学习·机器学习
惊鸿一博1 小时前
图像修复_MPMF-Net中的“多维特征交互块”(Multi-dimension Feature Interaction Block, MFIB)
图像处理·深度学习
大模型最新论文速读1 小时前
06-08 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
是Dream呀1 小时前
通道注意力机制|Channel Attention Neural Network
人工智能·python·深度学习
zhangfeng11331 小时前
思维链 ,Anthropic Mythos模型的 Looped Transformer架构解析,claud为什么厉害性能优越的研究
深度学习·架构·transformer
2401_836235861 小时前
从“扫卡“到“懂卡“:OCR银行卡识别产品的发展趋势与技术难点
人工智能·科技·深度学习·ocr·生活
RSTJ_16251 小时前
PYTHON+AI LLM DAY SEVENTY
人工智能·python·深度学习
武子康1 小时前
调查研究-159 Apple WWDC 2026 定档 6/8-12:Siri 与 AI 升级,可能是苹果最关键的一次
人工智能·深度学习·ios·ai·chatgpt·apple·wwdc