计算机视觉小目标检测模型

本文内容持续更新,敬请关注~

开源模型

1、FPN被应用于Faster R-CNN、RetinaNet等检测器中,改善了不同尺度目标的检测性能。​

https://arxiv.org/abs/1506.01497

https://github.com/ShaoqingRen/faster_rcnn

2、SRCNN(Super-Resolution Convolutional Neural Network) 是一个典型的超分辨率网络,通过在检测之前对图像进行超分辨率处理,提高了对低分辨率图像中的小目标的识别能力。

https://arxiv.org/abs/1501.00092

​​​​​​https://github.com/fuyongXu/SRCNN_Pytorch_1.0

https://github.com/tegg89/SRCNN-Tensorflow​

3、YOLO-S,一个轻量级的类YOLO网络,专为小目标检测设计。https://www.mdpi.com/1424-8220/23/4/1865

https://github.com/hustvl/YOLOS

只有论文

1、STO-DETR,基于transformer的专门针对小目标设计的,STO即Small Target Object,自己改 https://github.com/facebookresearch/detr

https://link.springer.com/chapter/10.1007/978-981-97-2977-7_48

2、SCAResNet,专门为小目标检测设计的ResNet变体,貌似有人改好了 https://github.com/LisavilaLee/SCAResNet_mmdet

https://arxiv.org/abs/2404.04179

3、Inside-Outside Net(ION) 是一种经典的上下文信息编码网络。ION通过将目标内外的上下文信息结合,改善了小目标检测效果

https://ieeexplore.ieee.org/document/7780683

4、FA-SSD,将上下文信息和注意力加入SSD

https://arxiv.org/pdf/1912.06319

只改模块

1、SPDConv, 2023用于低分辨率图像和小物体的新CNN模块

https://arxiv.org/abs/2208.03641

https://github.com/LabSAINT/SPD-Conv

相关推荐
我的世界伊若2 小时前
AI重塑IT职场:挑战与机遇并存
人工智能
lapiii3582 小时前
[智能体设计模式] 第4章:反思(Reflection)
人工智能·python·设计模式
IT_Beijing_BIT4 小时前
tensorflow 图像分类 之四
人工智能·分类·tensorflow
卡奥斯开源社区官方5 小时前
NVIDIA Blackwell架构深度解析:2080亿晶体管如何重构AI算力规则?
人工智能·重构·架构
百锦再5 小时前
第11章 泛型、trait与生命周期
android·网络·人工智能·python·golang·rust·go
数新网络8 小时前
The Life of a Read/Write Query for Apache Iceberg Tables
人工智能·apache·知识图谱
Yangy_Jiaojiao8 小时前
开源视觉-语言-动作(VLA)机器人项目全景图(截至 2025 年)
人工智能·机器人
gorgeous(๑>؂<๑)9 小时前
【ICLR26匿名投稿】OneTrackerV2:统一多模态目标跟踪的“通才”模型
人工智能·机器学习·计算机视觉·目标跟踪
坠星不坠9 小时前
pycharm如何导入ai大语言模型的api-key
人工智能·语言模型·自然语言处理
周杰伦_Jay9 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘