关于Deformable Convolution:自我整理一次可变形卷积

Deformable Conv用得很多,据我预期来说,可变形卷积就是让原来kernel中"定死"的参数变成"可学习的"参数,这样kernel的形状就会变来变去,最终提取出来的feature形状也更加多样

参考文章:CNN卷积神经网络之DCN(Deformable Convolutional Networks、Deformable ConvNets v2)_dcn神经网络-CSDN博客

参考视频:(这个博主值得关注哦) Enzo_Mi的个人空间-Enzo_Mi个人主页-哔哩哔哩视频 (bilibili.com)

(一)使用位置

并不是所有的卷积都一股脑地换成可行变卷积就是好的,在提取到一些语义特征后使用形变卷积效果会更好一点,一般来说是网络靠后的几层。

(二)弊端

因为可学习的参数增加了,所以 参数量会稍微增多 、 运行速度也会略微变慢

(三)其他

等待实践。。。

相关推荐
爱写代码的小朋友16 小时前
使用 OpenCV 进行人脸检测
人工智能·opencv·计算机视觉
Cici_ovo17 小时前
摄像头点击器常见问题——摄像头视窗打开慢
人工智能·单片机·嵌入式硬件·物联网·计算机视觉·硬件工程
思通数据19 小时前
AI助力医疗数据自动化:诊断报告识别与管理
大数据·人工智能·目标检测·机器学习·计算机视觉·目标跟踪·自动化
(●'◡'●)知20 小时前
基于树莓派的安保巡逻机器人--(一、快速人脸录入与精准人脸识别)
人工智能·python·opencv·机器学习·计算机视觉
程序小旭1 天前
DiffusionDet: Diffusion Model for Object Detection—用于对象检测的扩散模型论文解析
目标检测·计算机视觉·扩散模型
马甲是掉不了一点的<.<1 天前
计算机视觉常用数据集Cityscapes的介绍、下载、转为YOLO格式进行训练
人工智能·yolo·目标检测·计算机视觉·计算机视觉数据集
LeapMay1 天前
3D Gaussian Splatting 入门
计算机视觉·3d
BH042509091 天前
VQGAN(2021-06:Taming Transformers for High-Resolution Image Synthesis)
计算机视觉·扩散模型·图像生成·cv
BH042509091 天前
VQ-VAE(2018-05:Neural Discrete Representation Learning)
人工智能·计算机视觉
思通数科大数据舆情1 天前
开源AI助力医疗革新:OCR系统与知识图谱构建
人工智能·目标检测·机器学习·计算机视觉·目标跟踪·ocr·知识图谱