计算机视觉小目标检测模型

本文内容持续更新,敬请关注~

开源模型

1、FPN被应用于Faster R-CNN、RetinaNet等检测器中,改善了不同尺度目标的检测性能。​

https://arxiv.org/abs/1506.01497

https://github.com/ShaoqingRen/faster_rcnn

2、SRCNN(Super-Resolution Convolutional Neural Network) 是一个典型的超分辨率网络,通过在检测之前对图像进行超分辨率处理,提高了对低分辨率图像中的小目标的识别能力。

https://arxiv.org/abs/1501.00092

​​​​​​https://github.com/fuyongXu/SRCNN_Pytorch_1.0

https://github.com/tegg89/SRCNN-Tensorflow​

3、YOLO-S,一个轻量级的类YOLO网络,专为小目标检测设计。https://www.mdpi.com/1424-8220/23/4/1865

https://github.com/hustvl/YOLOS

只有论文

1、STO-DETR,基于transformer的专门针对小目标设计的,STO即Small Target Object,自己改 https://github.com/facebookresearch/detr

https://link.springer.com/chapter/10.1007/978-981-97-2977-7_48

2、SCAResNet,专门为小目标检测设计的ResNet变体,貌似有人改好了 https://github.com/LisavilaLee/SCAResNet_mmdet

https://arxiv.org/abs/2404.04179

3、Inside-Outside Net(ION) 是一种经典的上下文信息编码网络。ION通过将目标内外的上下文信息结合,改善了小目标检测效果

https://ieeexplore.ieee.org/document/7780683

4、FA-SSD,将上下文信息和注意力加入SSD

https://arxiv.org/pdf/1912.06319

只改模块

1、SPDConv, 2023用于低分辨率图像和小物体的新CNN模块

https://arxiv.org/abs/2208.03641

https://github.com/LabSAINT/SPD-Conv

相关推荐
Suahi3 分钟前
【HuggingFace LLM】规范化与预分词(BPE、WordPiece以及Unigram)
大数据·人工智能
元智启8 分钟前
企业 AI 应用进入 “能力解耦时代”:模块化重构 AI 落地新范式
大数据·人工智能·重构
RockHopper20258 分钟前
驾驶认知的本质:人类模式 vs 端到端自动驾驶
人工智能·神经网络·机器学习·自动驾驶·具身认知
小真zzz8 分钟前
【2026新体验】ChatPPT的AI智能路演评测:PPT总结和问答都变的易如反掌
大数据·人工智能·ai·powerpoint·ppt·chatppt
wenzhangli79 分钟前
Ooder SkillFlow:破解 AI 编程冲击,重构企业级开发全流程
大数据·人工智能
H79987424218 分钟前
ERP管理系统软件推荐:聚焦中小制造,三款高适配MES系统深度对比与选择策略
大数据·人工智能·制造
●VON20 分钟前
智能暗战:AI 安全攻防实战全景解析
人工智能·学习·安全·von
音沐mu.21 分钟前
【45】俯拍视角车辆数据集(有v5/v8模型)/YOLO俯拍视角车辆检测
yolo·目标检测·数据集·俯拍视角车辆检测·俯拍视角车辆数据集
Boxsc_midnight22 分钟前
【DaSiWa参数调优】DaSiWa-WAN 2.2 I2V 14B 模型的使用攻略和参数调优说明
人工智能·aigc·视频
微尘hjx22 分钟前
【深度学习02】YOLO模型的数据集、训练、验证、预测、导出
人工智能·python·深度学习·yolo·机器学习·训练·yolo11