车辆检测:An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

论文作者:Zhupeng Ye,Yinqi Li,Zejian Yuan

作者单位:Xi'an Jiaotong University

论文链接:http://arxiv.org/abs/2309.08369v1

项目链接:https://www.youtube.com/watch?v=1gk1PmsQ5Q8

内容简介:

1)方向:车辆检测

2)应用:智能驾驶

3)背景:现有的基于矩形边界框(BBox)的车辆检测方法在感知宽范围物体,特别是远距离的小物体方面存在困难。而且BBox表达不能提供车辆的详细几何形状和姿态信息。

4)方法:本文提出了一种新颖的基于单摄像头图像的宽范围伪3D车辆检测方法,并结合了高效的学习方法。该模型以拼接图像作为输入,该图像是通过将高分辨率图像的两个子窗口图像组合而成的。这种图像格式最大限度地利用了有限的图像分辨率,以保留关于宽范围车辆物体的基本信息。为了检测伪3D物体,我们的模型采用了专门设计的检测头。这些头部同时输出扩展的BBox和侧投影线(SPL)表示,捕捉车辆的形状和姿态,实现高精度检测。为了进一步提高检测性能,在模型训练过程中设计了一个联合约束损失,结合了物体框和SPL,提高了模型的效率、稳定性和预测准确性。

5)结果:在自建数据集上的实验结果表明,所提出模型在多个评估指标下实现了良好的宽范围伪3D车辆检测性能。演示视频已放置在https://www.youtube.com/watch?v=1gk1PmsQ5Q8

相关推荐
QYR_114 分钟前
2026-2032年耳轴夹具行业洞察:核心应用驱动下的市场增长路径
人工智能
硅谷秋水10 分钟前
一个务实的VLA基础模型
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人
wangqiaowq10 分钟前
Modbus TCP/RTU、OPC UA 和 MQTT 是工业自动化和物联网(IoT)领域中常用的通信协议
人工智能
漂视数字孪生世界10 分钟前
数字孪生,真的是展示价值大于实用性吗?
3d·信息可视化·数字孪生·可视化大屏·bi可视化
大模型任我行11 分钟前
阿里:LLM结构化数学推理评测基准
人工智能·语言模型·自然语言处理·论文笔记
进击ing小白16 分钟前
OpenCv之图像颜色空间介绍
人工智能·opencv·计算机视觉
lauo22 分钟前
【智体OS】ibbot智体机灵 V1.0:你的手机AI超脑,一句话开启智体时代————终将打败OpenClaw的国产开源项目
人工智能·智能手机
OPEN-Source23 分钟前
给 Agent 安装技能:工具抽象、自动选工具与安全边界
人工智能·python·agent·rag·deepseek
量化炼金 (CodeAlchemy)25 分钟前
【交易策略】低通滤波器策略:在小时图上捕捉中期动量
大数据·人工智能·机器学习·区块链
智算菩萨31 分钟前
上下文学习的贝叶斯推断视角:隐式梯度下降还是隐式贝叶斯?
人工智能·算法