车辆检测:An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

论文作者:Zhupeng Ye,Yinqi Li,Zejian Yuan

作者单位:Xi'an Jiaotong University

论文链接:http://arxiv.org/abs/2309.08369v1

项目链接:https://www.youtube.com/watch?v=1gk1PmsQ5Q8

内容简介:

1)方向:车辆检测

2)应用:智能驾驶

3)背景:现有的基于矩形边界框(BBox)的车辆检测方法在感知宽范围物体,特别是远距离的小物体方面存在困难。而且BBox表达不能提供车辆的详细几何形状和姿态信息。

4)方法:本文提出了一种新颖的基于单摄像头图像的宽范围伪3D车辆检测方法,并结合了高效的学习方法。该模型以拼接图像作为输入,该图像是通过将高分辨率图像的两个子窗口图像组合而成的。这种图像格式最大限度地利用了有限的图像分辨率,以保留关于宽范围车辆物体的基本信息。为了检测伪3D物体,我们的模型采用了专门设计的检测头。这些头部同时输出扩展的BBox和侧投影线(SPL)表示,捕捉车辆的形状和姿态,实现高精度检测。为了进一步提高检测性能,在模型训练过程中设计了一个联合约束损失,结合了物体框和SPL,提高了模型的效率、稳定性和预测准确性。

5)结果:在自建数据集上的实验结果表明,所提出模型在多个评估指标下实现了良好的宽范围伪3D车辆检测性能。演示视频已放置在https://www.youtube.com/watch?v=1gk1PmsQ5Q8

相关推荐
zhangshuang-peta4 分钟前
MCP 的落地路径:从 PoC 到规模化部署的 4 个阶段
人工智能·ai agent·mcp·peta
nap-joker6 分钟前
TIP:表格图像预训练模型用于不完整数据的多模态分类
人工智能·分类·数据挖掘·表格-影像融合·不完整数据
这辈子谁会真的心疼你7 分钟前
怎样让所有mp3声音大小一样?统一声音的两个方法
人工智能·ffmpeg·音视频
azurehan017 分钟前
计算机视觉学习笔记专有名词学习~1
笔记·学习·计算机视觉
Agent产品评测局8 分钟前
集团型企业自动化落地,如何实现多分支统一管控?——企业级智能体架构与选型深度实测
运维·人工智能·ai·chatgpt·架构·自动化
hans汉斯9 分钟前
【计算机科学与应用】面向警务业务的数据可视化处理平台设计与实现
人工智能·yolo·信息可视化·数据挖掘·区块链·汉斯出版社
芯盾时代10 分钟前
“十五五”规划纲要人工智能安全与治理政策深度解读
人工智能·安全·信息安全
康康的AI博客10 分钟前
深度:GPT-5.4实测,AI已自带“手脚”控电脑,这种混搭用法火了!
人工智能·gpt
code 小楊11 分钟前
Qwen3.5-Omni与Qwen3.6模型全面解析(含测评/案例/使用教程)
人工智能·开源
陈永坤11 分钟前
一文讲透:AI水印移除原理 + 图像/视频去水印完整实现方案(附实战工具)
人工智能·音视频