关于Deformable Convolution:自我整理一次可变形卷积

Deformable Conv用得很多,据我预期来说,可变形卷积就是让原来kernel中"定死"的参数变成"可学习的"参数,这样kernel的形状就会变来变去,最终提取出来的feature形状也更加多样

参考文章:CNN卷积神经网络之DCN(Deformable Convolutional Networks、Deformable ConvNets v2)_dcn神经网络-CSDN博客

参考视频:(这个博主值得关注哦) Enzo_Mi的个人空间-Enzo_Mi个人主页-哔哩哔哩视频 (bilibili.com)

(一)使用位置

并不是所有的卷积都一股脑地换成可行变卷积就是好的,在提取到一些语义特征后使用形变卷积效果会更好一点,一般来说是网络靠后的几层。

(二)弊端

因为可学习的参数增加了,所以 参数量会稍微增多 、 运行速度也会略微变慢

(三)其他

等待实践。。。

相关推荐
CoovallyAIHub3 天前
仿生学突破:SILD模型如何让无人机在电力线迷宫中发现“隐形威胁”
深度学习·算法·计算机视觉
CoovallyAIHub3 天前
从春晚机器人到零样本革命:YOLO26-Pose姿态估计实战指南
深度学习·算法·计算机视觉
CoovallyAIHub3 天前
Le-DETR:省80%预训练数据,这个实时检测Transformer刷新SOTA|Georgia Tech & 北交大
深度学习·算法·计算机视觉
CoovallyAIHub3 天前
强化学习凭什么比监督学习更聪明?RL的“聪明”并非来自算法,而是因为它学会了“挑食”
深度学习·算法·计算机视觉
CoovallyAIHub3 天前
YOLO-IOD深度解析:打破实时增量目标检测的三重知识冲突
深度学习·算法·计算机视觉
这张生成的图像能检测吗5 天前
(论文速读)XLNet:语言理解的广义自回归预训练
人工智能·计算机视觉·nlp·注意力机制
十铭忘5 天前
自主认知-行动1——架构
人工智能·计算机视觉
yuzhuanhei5 天前
YOLO26实操记录(自用)
人工智能·计算机视觉·目标跟踪
sali-tec5 天前
C# 基于OpenCv的视觉工作流-章27-图像分割
图像处理·人工智能·opencv·算法·计算机视觉
音视频牛哥5 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器