目标跟踪

AI浩14 小时前
人工智能·目标检测·目标跟踪
MODA:首个用于航空图像中多光谱目标检测的挑战性基准航空目标检测在实际场景中面临重大挑战,如小目标和广泛背景干扰,这些因素限制了基于RGB的检测器性能,因其缺乏足够的判别信息。多光谱图像(MSIs)捕获了多个波段的额外光谱线索,提供了有前景的替代方案。然而,训练数据的缺乏一直是挖掘MSIs潜力的主要瓶颈。为解决这一差距,我们引入了首个用于航空图像中多光谱目标检测(MODA)的大规模数据集,该数据集包含14,041张MSIs和330,191个标注,涵盖多样且具有挑战性的场景,为该领域提供了全面的数据基础。此外,为克服使用MSIs进行航空目标检测固有的挑战,我
Dekesas96952 天前
目标跟踪·分类
斑马鱼胚胎发育阶段分类与状态检测_-_基于改进的libra-retinanet算法嘿,宝子们!今天要给大家带来一篇超级硬核的博客,带你深度探索YOLO系列模型的发展历程!从经典的YOLOv3到最新的YOLOv13,每一个版本都凝聚着无数开发者的智慧结晶~😍 让我们一起揭开这些模型的神秘面纱吧!
牙牙要健康2 天前
yolo·目标检测·目标跟踪
【YOLOv8-Ultralytics】 【目标检测】【v8.3.235版本】 模型专用预测器代码predict.py解析代码路径:ultralytics\models\yolo\detect\predict.py这段代码是 Ultralytics YOLO 框架中目标检测模型专用预测器 DetectionPredictor 的核心实现,继承自基础预测器 BasePredictor,专门适配 YOLO 目标检测的推理全流程。其核心作用是将模型输出的原始预测张量,通过「非极大值抑制(NMS)过滤冗余框→坐标缩放还原至原始图像尺寸→结构化封装为 Results 对象」的流程,转换为可直接用于可视化、保存、下游分析的检测结果,同时
wfeqhfxz25887822 天前
人工智能·目标检测·目标跟踪
基于YOLOX-S的水下彩色球体目标检测与识别_8xb8-300e_coco水下环境中的目标检测一直是计算机视觉领域的难点挑战。由于水对光的吸收和散射效应,水下图像往往存在色彩失真、对比度降低、能见度下降等问题,这给目标检测带来了极大困难。本研究针对水下彩色球体目标检测这一特定场景,采用改进的YOLOX-S模型进行探索,旨在提高复杂水下环境中球体目标的检测准确率和识别精度。
Dingdangcat862 天前
算法·目标检测·目标跟踪
YOLO12-ADown改进算法:两轮车辆行驶环境中的多目标检测与识别_1🚴‍♂️🚲 两轮车辆环境下的目标检测一直是计算机视觉领域的热点和难点!随着电动自行车、摩托车等两轮车辆在城市交通中的普及,如何在复杂的道路环境中准确检测和识别这些车辆变得尤为重要。传统的目标检测算法在面对两轮车辆时往往存在漏检、误检等问题,特别是在光照变化、遮挡等复杂场景下表现不佳。
ʜᴇɴʀʏ2 天前
论文阅读·人工智能·目标检测·计算机视觉·目标跟踪
论文阅读 SAM 3: Segment Anything with ConceptsSAM 3是一个在图像和视频的可提示分割方面实现跨越式进步的模型。它提高了PVS(可提示视频分割)的性能,并为可提示概念分割(PCS)树立了新的标准。我们将PCS任务形式化为:以文本和/或图像示例作为输入,预测与该概念匹配的每个对象的实例掩码和语义掩码,同时在视频帧中保持对象的身份一致性)。为了专注于识别基本视觉概念,我们将文本限制为简单的名词短语(NP),例如“红苹果”或“条纹猫”,SAM 3具有完全的交互性,允许用户通过添加细化提示来解决歧义。 图2 在SA-Co基准测试上,与OWLv2(Minder
AAD555888992 天前
yolo·目标检测·目标跟踪
农业机械检测与识别46基于YOLOv8-SPPF-LSKA的Supperseeder和拖拉机目标检测系统_1该数据集名为"Tractor detection",版本为v2,于2024年4月26日通过qunshankj平台导出。qunshankj是一个端到端的计算机视觉平台,支持团队协作、图像收集与组织、非结构化图像数据理解与搜索、标注、数据集创建、模型训练与部署以及主动学习等功能。该数据集包含684张图像,所有图像均采用YOLOv8格式进行标注,主要针对两种农业机械目标:Supperseeder和tractor。在数据预处理方面,每张图像都应用了自动像素方向调整(剥离EXIF方向信息)和拉伸至640x640尺寸
AAD555888993 天前
人工智能·目标检测·目标跟踪
YOLOX-Nano彩色盒子目标检测:8x8批量训练300轮COCO数据集优化方案在计算机视觉领域,目标检测是一项基础且重要的任务,广泛应用于自动驾驶、安防监控、医疗影像分析等多个领域。本文将详细介绍如何使用YOLOX-Nano模型进行彩色盒子目标检测,并针对COCO数据集进行8x8批量训练300轮的优化方案。
AAD555888993 天前
目标跟踪·cnn
【番茄病害检测】基于Faster R-CNN的番茄黄叶卷曲病毒智能识别系统,完整实现与代码解析本数据集为番茄黄叶卷曲病毒(Yellow Leaf Curl Virus)图像检测数据集,采用YOLOv8格式标注,共包含2148张图像。数据集于2023年6月24日通过qunshankj平台导出,遵循CC BY 4.0许可协议。数据集在预处理阶段对每张原始图像应用了90度旋转增强技术,包括无旋转、顺时针旋转和逆时针旋转三种情况,每种情况具有相等的概率,从而创建了3个版本的图像,有效扩充了数据集规模。数据集包含训练集、验证集和测试集,采用标准的YOLOv8数据集划分方式。数据集的目标是检测和识别番茄植株中
资源补给站3 天前
人工智能·计算机视觉·目标跟踪
论文10-ICCV 2025 | WaveMamba:面向RGB-红外目标检测的多频域Mamba融合新范式论文题目: WaveMamba: Wavelet-driven Mamba Fusion for RGB-Infrared Object Detection
Yeats_Liao4 天前
人工智能·目标跟踪·机器人
CANN Samples(十九):特色场景:机器人 AI 绘画 手写识别等在我们之前的文章中,我们聊了许多关于图像分类、目标检测的话题,这些都是AI在“看懂”世界方面的应用。但AI的魅力远不止于此。当它与物理世界互动,会诞生出机器人;当它被赋予创造力,可以成为艺术家;当它学会理解人类的笔迹,便能打破数字世界与物理书写的隔阂。
gorgeous(๑>؂<๑)4 天前
人工智能·目标检测·计算机视觉·目标跟踪·无人机
【北理工-AAAI26】MODA:首个无人机多光谱目标检测数据集文章:MODA: The First Challenging Benchmark for Multispectral Object Detection in Aerial Images
AI浩4 天前
目标检测·目标跟踪·语言模型
ROD-MLLM:迈向多模态大语言模型中更可靠的目标检测https://openaccess.thecvf.com/content/CVPR2025/papers/Yin_ROD-MLLM_Towards_More_Reliable_Object_Detection_in_Multimodal_Large_Language_CVPR_2025_paper.pdf 多模态大语言模型(MLLMs)已展现出强大的语言理解和生成能力,在指代(referring)和定位(grounding)等视觉任务上表现卓越。然而,由于任务类型限制和数据集稀缺,现有的 MLLMs 仅
AI浩6 天前
人工智能·目标检测·目标跟踪
通过因果视觉提示实现单源域泛化目标检测单源域泛化目标检测(SDGOD)作为计算机视觉领域的前沿研究课题,旨在通过单源域训练增强模型在未见目标域中的泛化能力。当前主流方法试图通过数据增强技术来减轻域差异。然而,由于域偏移和有限的域特定知识,模型往往陷入虚假相关性的陷阱。这表现为模型过度依赖简单的分类特征(如颜色),而非像物体轮廓这样的基本域不变表示。为应对这一关键挑战,我们提出了Cauvis(因果视觉提示)方法。首先,我们引入了交叉注意力提示模块,通过将视觉提示与交叉注意力相结合,减轻虚假特征的偏差。为了解决单域泛化中视觉提示的域知识覆盖不足和
渡我白衣8 天前
人工智能·神经网络·机器学习·计算机视觉·目标跟踪·自然语言处理·知识图谱
AI应用层革命(五)——智能体的自主演化:从工具到生命本文为《AI应用层革命》系列第五篇,延续前四篇对智能体崛起、生态重构、社会秩序变革与人机共生形态的探讨。本篇将深入剖析智能体如何从“被设计”的工具,迈向“自我演化”的生命形态。我们将以技术逻辑为主线,结合认知科学、复杂系统理论与计算哲学,揭示智能体自主演化的本质机制,并展望其对人类文明结构的终极冲击。
龙邱科技8 天前
人工智能·计算机视觉·目标跟踪
21届智能车竞赛走马观碑组「灵眼LQUGSCV1」高帧率彩色USB摄像头实测!你是否也曾为智能车在弯道突然“失明”而功亏一篑?传统摄像头产生的运动拖影,让赛道边缘倾斜,让原本清晰的引导线变成了“鬼影”,导致智能车在高速运行时判断失误,错失良机。这可能并不是你算法的瓶颈而是视觉图像采集的“源头”出了问题!
爱写代码的小朋友8 天前
opencv·目标跟踪
OpenCV 视频目标跟踪详解:MeanShift 与 CamShift 算法实战在计算机视觉领域,视频目标跟踪(Video Object Tracking)是一项核心任务,广泛应用于智能监控、自动驾驶、人机交互、体育分析等场景。OpenCV 作为最流行的开源计算机视觉库之一,提供了多种成熟的目标跟踪算法,其中 MeanShift 和 CamShift 是两种经典且实用的方法。
中杯可乐多加冰9 天前
深度学习·yolo·目标检测·计算机视觉·目标跟踪·视觉检测·coco
【解决方案】PASCAL VOC 、YOLO txt、COCO目标检测三大格式简述与PASCAL VOC COCO格式互转在深度学习的浪潮中,目标检测作为计算机视觉的核心任务之一,其模型的性能和训练效率,往往取决于底层数据的质量和组织方式。数据标注格式,作为连接原始图像与模型训练的桥梁,其重要性不言而喻。
moonquakeTT9 天前
人工智能·matlab·目标跟踪·雷达
雷达调试5大核心思路:从理论到实战这次调试过程非常典型,涵盖了从雷达环境建模到信号处理算法实现的完整链路。为了方便你后续复盘和深入研究,我总结了以下 5 个关键的“核心思路”:
AI浩10 天前
目标检测·目标跟踪·架构
YOLO26:面向实时目标检测的关键架构增强与性能基准测试https://arxiv.org/pdf/2509.25164本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其在实时边缘目标检测方面的关键架构增强和性能基准测试。YOLO26于2025年9月发布,是YOLO家族中最新、最先进的成员,专为在边缘和低功耗设备上提供高效、准确且易于部署的解决方案而构建。本文依次详细介绍了YOLO26的架构创新,包括移除分布焦点损失(DFL)、采用端到端无NMS推理、集成渐进式损失平衡(ProgLoss)与小目标感知标签分配(STAL),以及引入用于稳定