车辆检测:An Efficient Wide-Range Pseudo-3D Vehicle Detection Using A Single Camera

论文作者:Zhupeng Ye,Yinqi Li,Zejian Yuan

作者单位:Xi'an Jiaotong University

论文链接:http://arxiv.org/abs/2309.08369v1

项目链接:https://www.youtube.com/watch?v=1gk1PmsQ5Q8

内容简介:

1)方向:车辆检测

2)应用:智能驾驶

3)背景:现有的基于矩形边界框(BBox)的车辆检测方法在感知宽范围物体,特别是远距离的小物体方面存在困难。而且BBox表达不能提供车辆的详细几何形状和姿态信息。

4)方法:本文提出了一种新颖的基于单摄像头图像的宽范围伪3D车辆检测方法,并结合了高效的学习方法。该模型以拼接图像作为输入,该图像是通过将高分辨率图像的两个子窗口图像组合而成的。这种图像格式最大限度地利用了有限的图像分辨率,以保留关于宽范围车辆物体的基本信息。为了检测伪3D物体,我们的模型采用了专门设计的检测头。这些头部同时输出扩展的BBox和侧投影线(SPL)表示,捕捉车辆的形状和姿态,实现高精度检测。为了进一步提高检测性能,在模型训练过程中设计了一个联合约束损失,结合了物体框和SPL,提高了模型的效率、稳定性和预测准确性。

5)结果:在自建数据集上的实验结果表明,所提出模型在多个评估指标下实现了良好的宽范围伪3D车辆检测性能。演示视频已放置在https://www.youtube.com/watch?v=1gk1PmsQ5Q8

相关推荐
新知图书1 天前
《LangGraph智能体设计模式与多智能体开发》1~6章试读
人工智能·langgraph·智能体设计模式·多智能体开发
财经资讯数据_灵砚智能1 天前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月30日
人工智能·信息可视化·自然语言处理
Bruce_Liuxiaowei1 天前
2026年4月第5周网络安全形势周报
人工智能·安全·web安全·网络安全·大模型
X54先生(人文科技)1 天前
泉州单元组协同铁律
人工智能·语言模型·开源协议
TickDB1 天前
MCP、WebSocket 与 Agentic Wallet:AI 自主交易的三把钥匙,同时转动了
人工智能·python·websocket
charlie1145141911 天前
通用GUI编程技术——图形渲染实战(四十)——深度缓冲与3D变换:从平面到立体
开发语言·c++·平面·3d·图形渲染·win32
广州服务器托管1 天前
[2026.4.27]WIN10.1809.17763.8647[PIIS]中简优化版LTSC2019 丝滑流畅 老爷机续命系统
运维·人工智能·windows·计算机网络·可信计算技术
jbk33111 天前
10分钟翻译一条视频,实现语音、字幕翻译后与画面同步对齐,视频翻译助手使用教程
人工智能·音视频·剪辑软件·剪映自动化软件
Cc不爱吃洋葱1 天前
RAG最佳实践:用 ElasticSearch 打造AI搜索系统与RAG 应用全流程详解!
人工智能·elasticsearch·大模型·大语言模型·rag·ai工具·大模型应用
黎阳之光1 天前
黎阳之光:视频孪生赋能国际盛会,定义数字孪生全球新标杆
大数据·人工智能·算法·安全·数字孪生