计算机视觉小目标检测模型

本文内容持续更新,敬请关注~

开源模型

1、FPN被应用于Faster R-CNN、RetinaNet等检测器中,改善了不同尺度目标的检测性能。​

https://arxiv.org/abs/1506.01497

https://github.com/ShaoqingRen/faster_rcnn

2、SRCNN(Super-Resolution Convolutional Neural Network) 是一个典型的超分辨率网络,通过在检测之前对图像进行超分辨率处理,提高了对低分辨率图像中的小目标的识别能力。

https://arxiv.org/abs/1501.00092

​​​​​​https://github.com/fuyongXu/SRCNN_Pytorch_1.0

https://github.com/tegg89/SRCNN-Tensorflow​

3、YOLO-S,一个轻量级的类YOLO网络,专为小目标检测设计。https://www.mdpi.com/1424-8220/23/4/1865

https://github.com/hustvl/YOLOS

只有论文

1、STO-DETR,基于transformer的专门针对小目标设计的,STO即Small Target Object,自己改 https://github.com/facebookresearch/detr

https://link.springer.com/chapter/10.1007/978-981-97-2977-7_48

2、SCAResNet,专门为小目标检测设计的ResNet变体,貌似有人改好了 https://github.com/LisavilaLee/SCAResNet_mmdet

https://arxiv.org/abs/2404.04179

3、Inside-Outside Net(ION) 是一种经典的上下文信息编码网络。ION通过将目标内外的上下文信息结合,改善了小目标检测效果

https://ieeexplore.ieee.org/document/7780683

4、FA-SSD,将上下文信息和注意力加入SSD

https://arxiv.org/pdf/1912.06319

只改模块

1、SPDConv, 2023用于低分辨率图像和小物体的新CNN模块

https://arxiv.org/abs/2208.03641

https://github.com/LabSAINT/SPD-Conv

相关推荐
霍小毛7 分钟前
破局工业数据孤岛!数字孪生+AI智慧设备资产管理平台,重构智能运维新范式
人工智能·重构
AI人工智能+15 分钟前
基于深度学习的银行回单识别技术,成为连接物理票据与数字财务系统的桥梁
深度学习·计算机视觉·ocr·银行回单识别
向量引擎17 分钟前
向量引擎的新时代:从OpenClaw、Hermes到GPT Image 2与龙虾(Lobster)模型的深度对比与应用
人工智能·gpt·aigc·api·ai编程·key·api调用
2501_9411491123 分钟前
智能家居的无声守护者:物联网系统自动化测试落地经验
人工智能·语音识别
ComputerInBook40 分钟前
数字图像处理(4版)——第 7 章——小波及其它图像变换(上)(Rafael C.Gonzalez&Richard E. Woods)
人工智能·机器学习·数字图像处理·图像变换
冬奇Lab1 小时前
烧了数千美金 Token,我用 AI Agent 打通了企业级 Bug 修复全流程
人工智能·debug
冬奇Lab2 小时前
一天一个开源项目(第85篇):TypeScript 巫师把自己的 Claude 配置推到了 GitHub,一夜全球第一
人工智能·开源·claude
爱艺江河2 小时前
智慧合规的HarmonyOS原生实践:与OpenClaw适配的项目方案浅析
人工智能·华为·harmonyos
xiaoduo AI2 小时前
客服机器人用知识图谱推理吗?Agent功能介绍+关联问答,跨品类问题能推导?
人工智能·机器人·知识图谱
Data-Miner2 小时前
数以轻舟聚焦Excel-Agent场景:当AI做表工具学会说人话
人工智能·excel