计算机视觉小目标检测模型

本文内容持续更新,敬请关注~

开源模型

1、FPN被应用于Faster R-CNN、RetinaNet等检测器中,改善了不同尺度目标的检测性能。​

https://arxiv.org/abs/1506.01497

https://github.com/ShaoqingRen/faster_rcnn

2、SRCNN(Super-Resolution Convolutional Neural Network) 是一个典型的超分辨率网络,通过在检测之前对图像进行超分辨率处理,提高了对低分辨率图像中的小目标的识别能力。

https://arxiv.org/abs/1501.00092

​​​​​​https://github.com/fuyongXu/SRCNN_Pytorch_1.0

https://github.com/tegg89/SRCNN-Tensorflow​

3、YOLO-S,一个轻量级的类YOLO网络,专为小目标检测设计。https://www.mdpi.com/1424-8220/23/4/1865

https://github.com/hustvl/YOLOS

只有论文

1、STO-DETR,基于transformer的专门针对小目标设计的,STO即Small Target Object,自己改 https://github.com/facebookresearch/detr

https://link.springer.com/chapter/10.1007/978-981-97-2977-7_48

2、SCAResNet,专门为小目标检测设计的ResNet变体,貌似有人改好了 https://github.com/LisavilaLee/SCAResNet_mmdet

https://arxiv.org/abs/2404.04179

3、Inside-Outside Net(ION) 是一种经典的上下文信息编码网络。ION通过将目标内外的上下文信息结合,改善了小目标检测效果

https://ieeexplore.ieee.org/document/7780683

4、FA-SSD,将上下文信息和注意力加入SSD

https://arxiv.org/pdf/1912.06319

只改模块

1、SPDConv, 2023用于低分辨率图像和小物体的新CNN模块

https://arxiv.org/abs/2208.03641

https://github.com/LabSAINT/SPD-Conv

相关推荐
CryptoPP15 分钟前
快速对接东京证券交易所API数据:实战指南与代码示例
开发语言·人工智能·windows·python·信息可视化·区块链
米小虾35 分钟前
AI Agent 上下文管理实战:让你的智能体不再"失忆"
人工智能·agent
凌云拓界1 小时前
文件管理:让AI安全操作你的电脑 ——CogitoAgent开发实战(三)
javascript·人工智能·架构·开源·node.js
火山引擎开发者社区1 小时前
Viking AI 搜索 CLI 正式发布:会说话,就能做搜索推荐
人工智能
探物 AI1 小时前
把 MambaOut 塞进 YOLOv11:会有什么样的反应
python·yolo·计算机视觉
云烟成雨TD1 小时前
Spring AI 1.x 系列【51】可观测性技术选型
java·人工智能·spring
unicrom_深圳市由你创科技1 小时前
基于Spring AI框架的RAG应用
人工智能·spring·机器学习
凌云拓界1 小时前
联网能力:让AI看见更广阔的世界 ——CogitoAgent开发实战(四)
javascript·人工智能·架构·node.js·创业创新
机器人零零壹1 小时前
南京越擎科技iRobotCAM:探索国产机器人离线编程工业软件的破局与赶超
人工智能·机器人·工业软件·离线编程·irobotcam