计算机视觉小目标检测模型

本文内容持续更新,敬请关注~

开源模型

1、FPN被应用于Faster R-CNN、RetinaNet等检测器中,改善了不同尺度目标的检测性能。​

https://arxiv.org/abs/1506.01497

https://github.com/ShaoqingRen/faster_rcnn

2、SRCNN(Super-Resolution Convolutional Neural Network) 是一个典型的超分辨率网络,通过在检测之前对图像进行超分辨率处理,提高了对低分辨率图像中的小目标的识别能力。

https://arxiv.org/abs/1501.00092

​​​​​​https://github.com/fuyongXu/SRCNN_Pytorch_1.0

https://github.com/tegg89/SRCNN-Tensorflow​

3、YOLO-S,一个轻量级的类YOLO网络,专为小目标检测设计。https://www.mdpi.com/1424-8220/23/4/1865

https://github.com/hustvl/YOLOS

只有论文

1、STO-DETR,基于transformer的专门针对小目标设计的,STO即Small Target Object,自己改 https://github.com/facebookresearch/detr

https://link.springer.com/chapter/10.1007/978-981-97-2977-7_48

2、SCAResNet,专门为小目标检测设计的ResNet变体,貌似有人改好了 https://github.com/LisavilaLee/SCAResNet_mmdet

https://arxiv.org/abs/2404.04179

3、Inside-Outside Net(ION) 是一种经典的上下文信息编码网络。ION通过将目标内外的上下文信息结合,改善了小目标检测效果

https://ieeexplore.ieee.org/document/7780683

4、FA-SSD,将上下文信息和注意力加入SSD

https://arxiv.org/pdf/1912.06319

只改模块

1、SPDConv, 2023用于低分辨率图像和小物体的新CNN模块

https://arxiv.org/abs/2208.03641

https://github.com/LabSAINT/SPD-Conv

相关推荐
新智元3 分钟前
刚刚,苹果大模型团队负责人叛逃 Meta!华人 AI 巨星 + 1,年薪飙至 9 位数
人工智能·openai
Cyltcc17 分钟前
如何安装和使用 Claude Code 教程 - Windows 用户篇
人工智能·claude·visual studio code
吹风看太阳1 小时前
机器学习16-总体架构
人工智能·机器学习
moonsims2 小时前
全国产化行业自主无人机智能处理单元-AI飞控+通信一体化模块SkyCore-I
人工智能·无人机
MUTA️2 小时前
ELMo——Embeddings from Language Models原理速学
人工智能·语言模型·自然语言处理
海豚调度2 小时前
Linux 基金会报告解读:开源 AI 重塑经济格局,有人失业,有人涨薪!
大数据·人工智能·ai·开源
T__TIII2 小时前
Dify 插件非正式打包
人工智能
jerwey2 小时前
大语言模型(LLM)按架构分类
人工智能·语言模型·分类
令狐少侠20112 小时前
ai之RAG本地知识库--基于OCR和文本解析器的新一代RAG引擎:RAGFlow 认识和源码剖析
人工智能·ai
小叮当爱咖啡2 小时前
Seq2seq+Attention 机器翻译
人工智能·自然语言处理·机器翻译