车辆检测:An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

论文作者:Zhupeng Ye,Yinqi Li,Zejian Yuan

作者单位:Xi'an Jiaotong University

论文链接:http://arxiv.org/abs/2309.08369v1

项目链接:https://www.youtube.com/watch?v=1gk1PmsQ5Q8

内容简介:

1)方向:车辆检测

2)应用:智能驾驶

3)背景:现有的基于矩形边界框(BBox)的车辆检测方法在感知宽范围物体,特别是远距离的小物体方面存在困难。而且BBox表达不能提供车辆的详细几何形状和姿态信息。

4)方法:本文提出了一种新颖的基于单摄像头图像的宽范围伪3D车辆检测方法,并结合了高效的学习方法。该模型以拼接图像作为输入,该图像是通过将高分辨率图像的两个子窗口图像组合而成的。这种图像格式最大限度地利用了有限的图像分辨率,以保留关于宽范围车辆物体的基本信息。为了检测伪3D物体,我们的模型采用了专门设计的检测头。这些头部同时输出扩展的BBox和侧投影线(SPL)表示,捕捉车辆的形状和姿态,实现高精度检测。为了进一步提高检测性能,在模型训练过程中设计了一个联合约束损失,结合了物体框和SPL,提高了模型的效率、稳定性和预测准确性。

5)结果:在自建数据集上的实验结果表明,所提出模型在多个评估指标下实现了良好的宽范围伪3D车辆检测性能。演示视频已放置在https://www.youtube.com/watch?v=1gk1PmsQ5Q8

相关推荐
枫叶林FYL几秒前
BRIDGE:多模态查询的强化学习对齐与文本检索重构
人工智能·语言模型
Sam09273 分钟前
Loop Engineering 是什么:让 AI Agent 从一次性回答变成可迭代执行
人工智能·ai
探物 AI5 分钟前
【3D·感知】从PointNet到PointPillars:如何让自动驾驶汽车“实时“看见3D世界?
3d·自动驾驶·汽车
TCW112112 分钟前
AI底层系列:用C++实现线性代数的公式推导与算法设计-6.线性方程组的解集
c++·人工智能·算法
古城小栈13 分钟前
Python 的主流Ai框架为什么优先适配 Linux 系统?
linux·人工智能·python
财经资讯数据_灵砚智能14 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月15日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
暮云星影16 分钟前
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)
arm开发·人工智能·语言模型·自然语言处理
ujainu小17 分钟前
CANN ops-transformer:编译和运行 FlashAttention 示例
人工智能·深度学习·transformer
Xiaofeng369320 分钟前
硬核编码与推理对决:Gemini 3.5 Flash vs GPT-5.5 真实能力横向测评
人工智能·gpt
邵宇然26 分钟前
编译优化技术全解:从 LLVM Pass 到链接时优化的性能提升路径
人工智能