关于Deformable Convolution:自我整理一次可变形卷积

Deformable Conv用得很多,据我预期来说,可变形卷积就是让原来kernel中"定死"的参数变成"可学习的"参数,这样kernel的形状就会变来变去,最终提取出来的feature形状也更加多样

参考文章:CNN卷积神经网络之DCN(Deformable Convolutional Networks、Deformable ConvNets v2)_dcn神经网络-CSDN博客

参考视频:(这个博主值得关注哦) Enzo_Mi的个人空间-Enzo_Mi个人主页-哔哩哔哩视频 (bilibili.com)

(一)使用位置

并不是所有的卷积都一股脑地换成可行变卷积就是好的,在提取到一些语义特征后使用形变卷积效果会更好一点,一般来说是网络靠后的几层。

(二)弊端

因为可学习的参数增加了,所以 参数量会稍微增多 、 运行速度也会略微变慢

(三)其他

等待实践。。。

相关推荐
audyxiao0013 小时前
期刊研究热点扫描|一文了解计算机视觉顶刊TIP的研究热点
人工智能·计算机视觉·transformer·图像分割·多模态
AI科技星4 小时前
为什么变化的电磁场才产生引力场?—— 统一场论揭示的时空动力学本质
数据结构·人工智能·经验分享·算法·计算机视觉
深蓝海拓4 小时前
opencv的模板匹配(Template Matching)学习笔记
人工智能·opencv·计算机视觉
Coding茶水间6 小时前
基于深度学习的路面坑洞检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
CoovallyAIHub7 小时前
如何在手机上轻松识别多种鸟类?我们发现了更简单的秘密……
深度学习·算法·计算机视觉
CoovallyAIHub7 小时前
抛弃LLM!MIT用纯视觉方法破解ARC难题,性能接近人类水平
深度学习·算法·计算机视觉
懷淰メ17 小时前
python3GUI--【AI加持】基于PyQt5+YOLOv8+DeepSeek的智能球体检测系统:(详细介绍)
yolo·目标检测·计算机视觉·pyqt·检测系统·deepseek·球体检测
0***1417 小时前
React计算机视觉应用
前端·react.js·计算机视觉
CV实验室1 天前
CV论文速递:覆盖视频生成与理解、3D视觉与运动迁移、多模态与跨模态智能、专用场景视觉技术等方向 (11.17-11.21)
人工智能·计算机视觉·3d·论文·音视频·视频生成
CoovallyAIHub1 天前
超越YOLOv8/v11!自研RKM-YOLO为输电线路巡检精度、速度双提升
深度学习·算法·计算机视觉