自动驾驶

地平线开发者1 小时前
算法·自动驾驶
征程 6 | 灰度图部署链路介绍相较于 RGB 三通道图像,灰度图仅保留亮度信息(Y 分量),数据量减少 2/3,相比于常用的 NV12 图像,数据量减少 1/3,内存占用与计算负载显著降低。对于下游网络结构而言,单通道网络计算量/参数量也会更少,这对边缘设备的实时处理至关重要。
地平线开发者2 小时前
算法·自动驾驶
手撕大模型|KVCache 原理及代码解析在大型语言模型(LLM)的推理过程中,KV Cache 是一项关键技术,它通过缓存中间计算结果显著提升了模型的运行效率。本文将深入解析 KV Cache 的工作原理、实现方式,并通过代码示例展示其在实际应用中的效果。
byzy2 小时前
论文阅读·深度学习·自动驾驶
【论文笔记】RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar原文链接:https://arxiv.org/abs/2405.14014给定4D雷达张量(4DRT) V ∈ R R × A × E × D V\in\mathbb R^{R\times A\times E\times D} V∈RR×A×E×D,目标是预测3D占用 O = { o i } i = 1 H × W × L O=\{o_i\}_{i=1}^{H\times W\times L} O={oi}i=1H×W×L,其中 o i ∈ { c 0 , c 1 , ⋯   , c C } o_i\in
auto-mooc3 小时前
自动驾驶·汽车·autosar·车载通信·智能网联汽车·域控制器
到底什么是智能网联汽车??第一期——感知引言目前,我国汽车技术正朝着电动化、智能化、网联化、共享化的“四化”方向发展,这给汽车工业的发展带来了巨大的挑战和机遇。智能网联汽车不仅可提供更安全、更舒适、更节能、更环保的驾驶方式,还会带来汽车产品和技术的升级,从而重塑汽车及相关产业全业态和价值链体系。
Uzuki8 小时前
目标检测·机器学习·自动驾驶·图形学
目标检测 | 基于Weiler–Atherton算法的IoU求解交并比(Intersection over Union, IoU) 是计算机视觉领域中常用的一个评价指标,尤其在目标检测与图像分割任务中,用于衡量预测结果与真实标注之间的重合程度。
地平线开发者11 小时前
算法·自动驾驶
工具链部署实用技巧 7|模型设计帧率推理时耗时与带宽分析在实际部署智能驾驶方案时,很多不同任务的模型会同时运行,在非正常情况下,模型按设计帧率运行时,每次运行花费的时间会不稳定。在这种情况下,我们要让模型按设计帧率运行,同时实时监测模型推理耗时和带宽使用情况,分析模型耗时不稳定时带宽占了多少。
byzy1 天前
论文阅读·深度学习·目标检测·计算机视觉·自动驾驶
【论文笔记】SpaRC: Sparse Radar-Camera Fusion for 3D Object Detection原文链接:https://arxiv.org/pdf/2411.19860图像由卷积特征提取器编码,而雷达点则由基于Transformer的点编码器处理。随后进行两阶段融合:第一阶段将雷达特征投影到图像上关联语义特征,第二阶段则从透视提案初始化稀疏3D物体查询,通过交叉注意力聚合多模态特征。距离自适应的雷达细化基于距离指导物体与雷达的交互,透视空间中的可变形注意力则捕捉语义特征。
Godspeed Zhao3 天前
人工智能·机器学习·自动驾驶
自动驾驶中的传感器技术40——Radar(1)如下图所示毫米波雷达的波长在4mm左右,远高于可见光和红外激光,传统的3D毫米波雷达提供距离向、水平方位向和速度向信息,目前开始流行的4D毫米波雷达可以提供距离向、水平方位向、俯仰向和速度向信息。
索迪迈科技3 天前
人工智能·重构·自动驾驶
登顶 NAVSIM!博世最新IRL-VLA:逆强化学习重构自动驾驶VLA闭环训练引入近年来,随着端到端自动驾驶技术的快速发展,吸引了来自工业界和学术界的广泛关注。此外,随着人类专家驾驶数据的逐渐积累,从大规模数据中学习类人的驾驶策略具有巨大的发展潜力。
Godspeed Zhao3 天前
人工智能·机器学习·自动驾驶
自动驾驶中的传感器技术42——Radar(3)车载毫米波雷达设计实例中的考虑点从上图可以看到,目前3D雷达的套片主流供应商是TI、NXP、Infineon。4D雷达的套片供应商增加了不少新出现的公司;
Godspeed Zhao3 天前
人工智能·机器学习·自动驾驶
自动驾驶中的传感器技术41——Radar(2)本文系统性介绍毫米波雷达MMIC芯片。A. Phase Shift Control:• 0° / 180° BPM
Hi202402173 天前
数码相机·线性代数·矩阵·自动驾驶·apollo
使用 Apollo TransformWrapper 生成相机到各坐标系的变换矩阵在自动驾驶系统中,车辆配备了多种传感器,如相机、激光雷达(LiDAR)、毫米波雷达和定位设备(如 Novatel)。这些传感器各自采集的数据需要统一到同一个坐标系下,才能进行融合处理和后续的感知、定位与决策。例如,相机捕获的图像需要与激光雷达的点云数据进行对齐,从而更准确地识别障碍物或理解环境。
Godspeed Zhao4 天前
人工智能·机器学习·自动驾驶·毫米波雷达
自动驾驶中的传感器技术39——Radar(0)下图是车载毫米波雷达的发展脉络,可以看到,主要三个脉络(更早期的不再讨论):基于SiGe芯片工艺的24GHz车载毫米波雷达发展,目前24GHz已经不再用于车载毫米波雷达上;
Ray Song4 天前
xml·中间件·自动驾驶·dds·fastdds
【FastDDS】XML profileseProsima Fast DDS 允许加载 XML 配置文件,每个文件可包含一个或多个 XML 配置文件(profile)。除了用于加载用户 XML 文件的 API 函数外,Fast DDS 在初始化时还会尝试查找并加载多个 XML 文件。Fast DDS 提供以下选项:
算法打盹中5 天前
人工智能·机器学习·计算机视觉·语言模型·自动驾驶
SimLingo:纯视觉框架下的自动驾驶视觉 - 语言 - 动作融合模型本文深入探讨了 SimLingo,一个在自动驾驶领域具有开创性意义的视觉-语言-动作一体化模型。SimLingo 创新性地将自动驾驶、语言理解和指令感知控制整合到一个统一的纯摄像头框架中,显著提升了自动驾驶系统在复杂环境中的感知、决策与执行能力。该模型在 CARLA Leaderboard 2.0 和 Bench2Drive 等权威基准测试中表现卓越,并在 2024 年 CARLA 挑战赛中荣获桂冠,充分证明了其在模拟环境下的强大性能和鲁棒性。SimLingo 的核心优势在于其不依赖激光雷达或雷达等昂贵传
Ray Song6 天前
中间件·自动驾驶·dds·mcap
MCAP :机器人数据容器的全面实践指南Outline:MCAP 已形成完整工具链生态:随着 IEEE 正在制定的 P3196 机器人数据标准,MCAP 正在演进为行业基础架构的重要组成。其设计哲学启示我们:优秀的数据格式应该在存储效率与读取便利间找到平衡,这正是 MCAP 在机器人革命中脱颖而出的关键。
Ray Song6 天前
中间件·自动驾驶·dds·fastdds
【FastDDS】Layer Transport ( 05-Shared Memory Transport)共享内存(SHM)传输依靠主机操作系统提供的共享内存机制,实现了在同一处理单元/机器上运行的实体之间的快速通信。
catcfm7 天前
人工智能·深度学习·语言模型·自动驾驶
MiniDrive:面向自动驾驶的更高效的视觉语言模型存在的问题本文方法任务及结果如下图所示,MiniDrive 处理多张输入图像及用户指令,生成自然语言响应,包括自动驾驶中最关键的感知、规划和预测问答能力
地平线开发者7 天前
人工智能·自动驾驶·汽车
理想汽车智驾方案介绍 4 World model + 强化学习重建自动驾驶交互环境【理想汽车智驾方案介绍专题 -1】端到端+VLM 方案介绍【理想汽车智驾方案介绍专题 -2】MindVLA 方案详解
博大世界7 天前
人工智能·机器学习·自动驾驶
解剖智驾“大脑”:一文读懂自动驾驶系统软件架构大家好,我是[您的博客昵称]。很多车友喜欢对比智驾芯片的算力,仿佛Tops数就是一切。这好比对比两台电脑,只关心CPU的GHz,却不管它的操作系统、软件生态和算法优化。