目标跟踪

Yeats_Liao2 小时前
人工智能·目标跟踪·机器人
CANN Samples(十九):特色场景:机器人 AI 绘画 手写识别等在我们之前的文章中,我们聊了许多关于图像分类、目标检测的话题,这些都是AI在“看懂”世界方面的应用。但AI的魅力远不止于此。当它与物理世界互动,会诞生出机器人;当它被赋予创造力,可以成为艺术家;当它学会理解人类的笔迹,便能打破数字世界与物理书写的隔阂。
gorgeous(๑>؂<๑)14 小时前
人工智能·目标检测·计算机视觉·目标跟踪·无人机
【北理工-AAAI26】MODA:首个无人机多光谱目标检测数据集文章:MODA: The First Challenging Benchmark for Multispectral Object Detection in Aerial Images
AI浩19 小时前
目标检测·目标跟踪·语言模型
ROD-MLLM:迈向多模态大语言模型中更可靠的目标检测https://openaccess.thecvf.com/content/CVPR2025/papers/Yin_ROD-MLLM_Towards_More_Reliable_Object_Detection_in_Multimodal_Large_Language_CVPR_2025_paper.pdf 多模态大语言模型(MLLMs)已展现出强大的语言理解和生成能力,在指代(referring)和定位(grounding)等视觉任务上表现卓越。然而,由于任务类型限制和数据集稀缺,现有的 MLLMs 仅
AI浩3 天前
人工智能·目标检测·目标跟踪
通过因果视觉提示实现单源域泛化目标检测单源域泛化目标检测(SDGOD)作为计算机视觉领域的前沿研究课题,旨在通过单源域训练增强模型在未见目标域中的泛化能力。当前主流方法试图通过数据增强技术来减轻域差异。然而,由于域偏移和有限的域特定知识,模型往往陷入虚假相关性的陷阱。这表现为模型过度依赖简单的分类特征(如颜色),而非像物体轮廓这样的基本域不变表示。为应对这一关键挑战,我们提出了Cauvis(因果视觉提示)方法。首先,我们引入了交叉注意力提示模块,通过将视觉提示与交叉注意力相结合,减轻虚假特征的偏差。为了解决单域泛化中视觉提示的域知识覆盖不足和
渡我白衣4 天前
人工智能·神经网络·机器学习·计算机视觉·目标跟踪·自然语言处理·知识图谱
AI应用层革命(五)——智能体的自主演化:从工具到生命本文为《AI应用层革命》系列第五篇,延续前四篇对智能体崛起、生态重构、社会秩序变革与人机共生形态的探讨。本篇将深入剖析智能体如何从“被设计”的工具,迈向“自我演化”的生命形态。我们将以技术逻辑为主线,结合认知科学、复杂系统理论与计算哲学,揭示智能体自主演化的本质机制,并展望其对人类文明结构的终极冲击。
龙邱科技5 天前
人工智能·计算机视觉·目标跟踪
21届智能车竞赛走马观碑组「灵眼LQUGSCV1」高帧率彩色USB摄像头实测!你是否也曾为智能车在弯道突然“失明”而功亏一篑?传统摄像头产生的运动拖影,让赛道边缘倾斜,让原本清晰的引导线变成了“鬼影”,导致智能车在高速运行时判断失误,错失良机。这可能并不是你算法的瓶颈而是视觉图像采集的“源头”出了问题!
爱写代码的小朋友5 天前
opencv·目标跟踪
OpenCV 视频目标跟踪详解:MeanShift 与 CamShift 算法实战在计算机视觉领域,视频目标跟踪(Video Object Tracking)是一项核心任务,广泛应用于智能监控、自动驾驶、人机交互、体育分析等场景。OpenCV 作为最流行的开源计算机视觉库之一,提供了多种成熟的目标跟踪算法,其中 MeanShift 和 CamShift 是两种经典且实用的方法。
中杯可乐多加冰5 天前
深度学习·yolo·目标检测·计算机视觉·目标跟踪·视觉检测·coco
【解决方案】PASCAL VOC 、YOLO txt、COCO目标检测三大格式简述与PASCAL VOC COCO格式互转在深度学习的浪潮中,目标检测作为计算机视觉的核心任务之一,其模型的性能和训练效率,往往取决于底层数据的质量和组织方式。数据标注格式,作为连接原始图像与模型训练的桥梁,其重要性不言而喻。
moonquakeTT6 天前
人工智能·matlab·目标跟踪·雷达
雷达调试5大核心思路:从理论到实战这次调试过程非常典型,涵盖了从雷达环境建模到信号处理算法实现的完整链路。为了方便你后续复盘和深入研究,我总结了以下 5 个关键的“核心思路”:
AI浩6 天前
目标检测·目标跟踪·架构
YOLO26:面向实时目标检测的关键架构增强与性能基准测试https://arxiv.org/pdf/2509.25164本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其在实时边缘目标检测方面的关键架构增强和性能基准测试。YOLO26于2025年9月发布,是YOLO家族中最新、最先进的成员,专为在边缘和低功耗设备上提供高效、准确且易于部署的解决方案而构建。本文依次详细介绍了YOLO26的架构创新,包括移除分布焦点损失(DFL)、采用端到端无NMS推理、集成渐进式损失平衡(ProgLoss)与小目标感知标签分配(STAL),以及引入用于稳定
徽4409 天前
人工智能·目标检测·目标跟踪
农田植被目标检测数据标注与模型训练总结2一、数据集标注工作围绕目标检测模型训练的核心需求,本周重点完成了图片标注全流程工作,为 YOLOv5 模型训练筑牢数据基础:
CV爱数码9 天前
人工智能·深度学习·目标检测·计算机视觉·目标跟踪·数据集
【宝藏数据集】MCOD:多光谱伪装目标检测首个挑战性基准最近挖到一个计算机视觉领域的稀缺宝藏数据集 ——MCOD,它是首个专门为多光谱伪装目标检测设计的挑战性基准数据集,已被 MM '25(第 33 届 ACM 国际多媒体会议)收录,对做伪装目标检测、多光谱图像处理相关研究的小伙伴来说太实用了,赶紧存下来分享一波!
极智视界11 天前
人工智能·目标检测·目标跟踪
目标检测数据集 - 卫星图像船舶检测数据集下载数据集点击蓝色链接下载 (若想要更多数量数据集请联系博主 ~):目标检测数据集下载大全传送:目标检测数据集大全「包含VOC+COCO+YOLO三种格式+划分脚本+训练脚本」(持续原地更新)
Together_CZ11 天前
人工智能·目标跟踪·rex-omni·detect anything·next point·prediction·通过下一个点预测检测任何事物
Rex-Omni:Detect Anything via Next Point Prediction——通过下一个点预测检测任何事物这篇文章介绍了一个名为 Rex-Omni 的多模态大型语言模型(MLLM),它在目标检测任务上取得了显著的性能提升,同时具备强大的语言理解能力。以下是文章的主要研究内容概括:
Eric.Lee202112 天前
人工智能·计算机视觉·目标跟踪·yolo目标检测·yolo-webui
ultralytics-yolo-webui 项目介绍及使用演示ultralytics-yolo-webui 是一个基于 Ultralytics YOLO 框架的 WebUI 工具(由 DataBall 开发),旨在提供可视化界面简化 YOLO 目标检测模型的训练、推理及数据预处理流程,降低目标检测任务的使用门槛。
AI浩12 天前
人工智能·目标检测·目标跟踪
基于检测变换器的无源目标检测https://papers-pdfs.assets.alphaxiv.org/2510.11090v1.pdf 无源目标检测(SFOD)能够将知识从源域迁移到无监督目标域,以进行目标检测,而无需访问源数据。大多数现有的SFOD方法要么局限于传统目标检测(OD)模型(如Faster R-CNN),要么设计为通用解决方案,没有为新颖的OD架构(特别是检测变换器DETR)量身定制适配。在本文中,我们提出了特征重加权和对比学习网络(FRANCK),这是一个专为DETR执行以查询为中心的特征增强而设计的新型SFO
AI浩12 天前
人工智能·目标检测·目标跟踪
LMM-Det:让大型多模态模型在目标检测中脱颖而出https://arxiv.org/pdf/2507.18300 大型多模态模型因其在多模态理解、推理和上下文学习等方面的卓越能力,在人工智能研究和工业界引起了广泛的关注和兴趣。虽然 LMM 在图像描述、视觉问答和视觉定位等多模态任务上已展现出有前景的结果,但其目标检测能力与专业检测器相比仍存在显著差距。为弥补这一差距,我们摒弃了将重型检测器与 LMM 集成的传统方法,提出了 LMM-Det,这是一种简单而有效的方法,它利用大型多模态模型进行纯目标检测,而无需依赖专门的检测模块。具体来说,我们进行了全面的
moonquakeTT12 天前
人工智能·算法·目标跟踪·fmcw毫米波
雷达信号处理中的CFAR检测关键要点本次讨论和实践涵盖了雷达信号处理中恒虚警(CFAR)检测的理论基础、算法实现,以及在实际雷达数据仿真中遇到的关键工程问题。
moonquakeTT12 天前
人工智能·机器学习·matlab·目标跟踪·雷达
雷达信号处理中的CFAR技术详解好的,我来为您总结归纳雷达信号处理中的恒虚警(CFAR)技术,并提供一个基于MATLAB的实际用例。恒虚警率(Constant False Alarm Rate, CFAR)是一种自适应阈值目标检测技术,在雷达信号处理中用于从噪声和杂波背景中检测出目标回波。其核心思想是:无论背景噪声或杂波的功率如何变化,都保持虚警概率()为一个预先设定的常数。