车辆检测:An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

论文作者:Zhupeng Ye,Yinqi Li,Zejian Yuan

作者单位:Xi'an Jiaotong University

论文链接:http://arxiv.org/abs/2309.08369v1

项目链接:https://www.youtube.com/watch?v=1gk1PmsQ5Q8

内容简介:

1)方向:车辆检测

2)应用:智能驾驶

3)背景:现有的基于矩形边界框(BBox)的车辆检测方法在感知宽范围物体,特别是远距离的小物体方面存在困难。而且BBox表达不能提供车辆的详细几何形状和姿态信息。

4)方法:本文提出了一种新颖的基于单摄像头图像的宽范围伪3D车辆检测方法,并结合了高效的学习方法。该模型以拼接图像作为输入,该图像是通过将高分辨率图像的两个子窗口图像组合而成的。这种图像格式最大限度地利用了有限的图像分辨率,以保留关于宽范围车辆物体的基本信息。为了检测伪3D物体,我们的模型采用了专门设计的检测头。这些头部同时输出扩展的BBox和侧投影线(SPL)表示,捕捉车辆的形状和姿态,实现高精度检测。为了进一步提高检测性能,在模型训练过程中设计了一个联合约束损失,结合了物体框和SPL,提高了模型的效率、稳定性和预测准确性。

5)结果:在自建数据集上的实验结果表明,所提出模型在多个评估指标下实现了良好的宽范围伪3D车辆检测性能。演示视频已放置在https://www.youtube.com/watch?v=1gk1PmsQ5Q8

相关推荐
charlie1145141911 分钟前
机器学习概论:一门教计算机如何“不确定地正确”的学问
人工智能·笔记·机器学习·工程实践
凡。。。2963 分钟前
APS概念-EOQ模型
人工智能·制造
FreeBuf_6 分钟前
MEDUSA安全测试工具:集成74种扫描器与180余项AI Agent安全规则
人工智能·安全
迅为电子7 分钟前
迅为iTOP-Hi3403开发板:解锁多目拼接相机的10.4TOPS强“芯”动力,开启4K智能视觉新纪元
人工智能·itop-hi3403开发板·海思hi3403·多目拼接相机
小润nature9 分钟前
MCP Apps 交互式 GUI 完整指南
人工智能
Piar1231sdafa10 分钟前
YOLO11-EfficientRepBiPAN:海军制服军衔智能识别的革命性突破
人工智能·计算机视觉·目标跟踪
杜子不疼.13 分钟前
加载了cpolar的Reader 电子书管理工具远程使用体验
linux·人工智能
智绘前端13 分钟前
GitHub 登录功能开发 SOP
人工智能·typescript·github·reactjs
ViiTor_AI14 分钟前
AI 语音克隆入门指南:如何用 3 秒音频生成真实人声?
人工智能·音视频·语音识别
星图易码17 分钟前
DevMate.SCADA操作指引|3D组态管道创建
3d