车辆检测:An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

论文作者:Zhupeng Ye,Yinqi Li,Zejian Yuan

作者单位:Xi'an Jiaotong University

论文链接:http://arxiv.org/abs/2309.08369v1

项目链接:https://www.youtube.com/watch?v=1gk1PmsQ5Q8

内容简介:

1)方向:车辆检测

2)应用:智能驾驶

3)背景:现有的基于矩形边界框(BBox)的车辆检测方法在感知宽范围物体,特别是远距离的小物体方面存在困难。而且BBox表达不能提供车辆的详细几何形状和姿态信息。

4)方法:本文提出了一种新颖的基于单摄像头图像的宽范围伪3D车辆检测方法,并结合了高效的学习方法。该模型以拼接图像作为输入,该图像是通过将高分辨率图像的两个子窗口图像组合而成的。这种图像格式最大限度地利用了有限的图像分辨率,以保留关于宽范围车辆物体的基本信息。为了检测伪3D物体,我们的模型采用了专门设计的检测头。这些头部同时输出扩展的BBox和侧投影线(SPL)表示,捕捉车辆的形状和姿态,实现高精度检测。为了进一步提高检测性能,在模型训练过程中设计了一个联合约束损失,结合了物体框和SPL,提高了模型的效率、稳定性和预测准确性。

5)结果:在自建数据集上的实验结果表明,所提出模型在多个评估指标下实现了良好的宽范围伪3D车辆检测性能。演示视频已放置在https://www.youtube.com/watch?v=1gk1PmsQ5Q8

相关推荐
冬奇Lab39 分钟前
一天一个开源项目(第68篇):DeerFlow - 字节跳动出品的深度研究与超级智能体框架
人工智能·开源·资讯
NineData1 小时前
NineData V5.0 产品发布会:让 AI 成为数据管理的驱动力,4月16日!
数据库·人工智能·ai编程
罗西的思考1 小时前
【OpenClaw】通过 Nanobot 源码学习架构---(5)Context
人工智能·算法·机器学习
2301_764441331 小时前
claw-code:基于Claude Code架构的clean-room重写开源项目
人工智能·架构·开源
模拟器连接器曾工2 小时前
CCD定位与图像辨别的智能视觉检测系统
人工智能·计算机视觉·视觉检测·智能视觉检测系统
云栖梦泽2 小时前
AI安全合规与治理:行业发展趋势与职业展望
大数据·人工智能·安全
小陈工2 小时前
2026年4月2日技术资讯洞察:数据库融合革命、端侧AI突破与脑机接口产业化
开发语言·前端·数据库·人工智能·python·安全
happyprince3 小时前
2026年04月07日热门模型
人工智能
IT_陈寒3 小时前
Vue的这个响应式问题,坑了我整整两小时
前端·人工智能·后端
HIT_Weston3 小时前
41、【Agent】【OpenCode】本地代理分析(五)
javascript·人工智能·opencode