自动驾驶

m0_650108246 小时前
论文阅读·自动驾驶·轨迹规划·感知、规划与生成融合·场景理解·未来图像生成
UniDrive-WM:自动驾驶领域的统一理解、规划与生成世界模型在自动驾驶技术的发展进程中,世界模型扮演着核心角色,精准的场景理解与未来预测是保障驾驶安全的关键。当前,尽管已有研究尝试将视觉 - 语言模型(VLMs)应用于规划任务,但大多将感知、预测和规划视为独立模块,存在信息传递瓶颈与误差累积等问题。为此,来自博世北美研究院、华盛顿大学等机构的研究团队提出了 UniDrive-WM,一种基于 VLM 的统一世界模型,在单一架构中实现了驾驶场景理解、轨迹规划和轨迹条件下的未来图像生成。
jinyeyiqi20268 小时前
人工智能·机器学习·自动驾驶
气象监测设备如何助力精细化环境管理?金叶仪器智能气象站方案探讨在环境监测领域,气象数据的精准获取与分析对于生产生活、公共安全及生态保护具有基础性意义。随着传感技术与物联网的融合发展,气象监测设备正朝着智能化、集成化方向演进。金叶仪器(山东)有限公司基于多年环境监测设备研发经验,推出新一代智能气象监测站,旨在为用户提供稳定、实用的气象数据采集解决方案。
renhongxia112 小时前
人工智能·深度学习·机器学习·语言模型·自动驾驶·逻辑回归
COVLM-RL:利用VLM引导强化学习实现自动驾驶的关键面向对象推理端到端自动驾驶框架在泛化能力、训练效率和可解释性方面长期面临挑战。现有方法虽利用视觉语言模型通过大规模数据集监督学习来提升推理能力,但在新场景中往往缺乏鲁棒性;而基于强化学习的方法虽增强了适应性,却存在数据效率低下和决策过程不透明的问题。
Coovally AI模型快速验证12 小时前
人工智能·机器学习·计算机视觉·目标跟踪·自动驾驶·ocr
“看起来像世界”≠“真世界”!WorldLens全维度解构自动驾驶世界模型近年来,随着生成式AI技术的突破,世界模型(World Models) 已成为自动驾驶与具身智能领域的核心研究方向。从文本直接生成驾驶视频,到可控的4D动态场景合成,当前模型已经能够产出视觉上足以“以假乱真”的驾驶画面。
Godspeed Zhao13 小时前
人工智能·机器学习·自动驾驶
自动驾驶中的传感器技术89——Sensor Fusion(12)https://www.thinkautonomous.ai/blog/tesla-end-to-end-deep-learning/
神经蛙没头脑13 小时前
人工智能·神经网络·机器学习·计算机视觉·语言模型·自然语言处理·自动驾驶
2026年AI产品榜·全球总榜, 2月3日更新AI产品榜·全球总榜,涵盖 网站榜(Webstie) 和 应用榜(App) 两大平台。网站榜(Webstie) 按照 Webstie 访问量 排名,时间周期 2025年12月。应用榜(App) 按照 App 月活跃用户 排名,时间周期 2026年1月。
智车科技14 小时前
人工智能·自动驾驶·智慧城市
知行科技与印度头部汽车零部件供应商Uno Minda签署战略合作协议近日,知行科技与Uno Minda Limited签署ADAS解决方案战略合作协议,双方将首先基于一款明确车型进行ADAS方案的印度本土化开发,并在未来不断拓展合作广度和深度,通过战略协同把握好印度汽车市场电动化、智能化转型的重要机遇期。
QBoson16 小时前
人工智能·自动驾驶·无人机·量子计算
量子赋能多智能体路径规划:破解无人机、自动驾驶的 “避撞难题”本文为《 Hybrid Quantum-Classical Multi-Agent Pathfinding 》的阅读笔记,原文链接: [2501.14568] Hybrid Quantum-Classical Multi-Agent Pathfinding。
万事ONES1 天前
人工智能·机器学习·自动驾驶
ONES 签约北京高级别自动驾驶示范区专设国有运营平台——北京车网ONES 签约北京市高级别自动驾驶示范区专设国有运营平台——北京车网。北京车网是北京市首家智能网联领域基础设施投资运营平台,曾公开发布全球首个自动驾驶车路协同数据集 DAIR-V2X,及全球首个开源开放智能网联路侧操作系统 “智路 OS”,在车联网与自动驾驶领域具备显著的行业引领地位。
王锋(oxwangfeng)1 天前
人工智能·机器学习·自动驾驶
基于 DINO 与 Chinese-CLIP 的自动驾驶语义检索系统架构✅ 使用 DINO 的 视觉编码器(ViT-Huge) 提取图像特征,再配合 Open-Vocabulary Detection 方法实现“开集检测”
数据与后端架构提升之路2 天前
架构·自动驾驶·软考
论边云协同架构在自动驾驶系统中的应用2024年3月,我参与了某科技公司“新一代L4级自动驾驶测试平台”的研发工作,在项目中担任系统架构师,负责整体技术架构设计与核心模块选型。该平台旨在解决复杂城市工况下的自动巡航、动态避障与路径规划难题。鉴于自动驾驶车辆(端侧)每日产生TB级海量数据,且对决策延迟有毫秒级的严苛要求,传统单一的云计算或边缘计算模式均无法满足系统在实时性、带宽成本及模型迭代效率上的综合指标。因此,我设计了一套基于KubeEdge的边云协同架构。本文将结合项目实践,从资源协同、数据协同、智能协同及应用管理协同四个维度,详细论述该
.小墨迹2 天前
c++·人工智能·学习·算法·ubuntu·开源·自动驾驶
开源的自动驾驶框架目前主流的开源自动驾驶框架,这类框架覆盖了从入门学习、算法研发到工程落地、实车部署的全场景,核心分为全栈式框架(覆盖感知/预测/决策/规划/控制全流程,可直接对接实车)和模块化框架(聚焦单一环节,适合算法定制开发),同时还有轻量化入门框架(适合新手快速上手)。
audyxiao0012 天前
人工智能·机器学习·自动驾驶·tits
智能交通顶刊TITS论文分享|如何利用驾驶感知世界模型实现无信号灯路口自动驾驶?本推文介绍了智能交通领域顶级期刊IEEE Transactions on Intelligent Transportation Systems(简称为TITS)的一篇论文《Integrating Driving-Aware World Model With MPC for Autonomous Driving at Unsignalized T-Intersections》。该论文提出了一种集成了驾驶感知世界模型与模型预测路径积分控制的端到端自动驾驶框架,旨在解决自动驾驶车辆在无信号灯T型路口等复杂交互场
hjs_deeplearning2 天前
人工智能·语言模型·自动驾驶
文献阅读篇#16:自动驾驶中的视觉语言模型:综述与展望(翻译)自动驾驶中的视觉语言模型:综述与展望文章发表于一区Top期刊IEEE Transactions on Intelligent Vehicles,DOI 10.1109/TIV.2024.3402136
Godspeed Zhao2 天前
人工智能·机器学习·自动驾驶
自动驾驶中的传感器技术24.3——Camera(18)Camera图像处理流摘要:本文详细解析了Camera图像处理流程,涵盖从光信号转换为数字信号到最终生成可用图像的三个阶段:感知与传输、接口与缓冲、ISP处理。重点介绍了CMOS图像传感器的HDR和LFM特性,以及数据在SoC内部通过DDR多级缓存和处理的过程。同时阐述了高通CamX-Chi软件架构的分层设计,包括应用层、服务层、用户空间驱动层及内核空间驱动,并分析了AIS服务在汽车领域的快速启动和多客户端共享优势。最后概述了V4L2接口的视频采集标准流程及其在自动驾驶场景中的零拷贝优化实现。
小康小小涵2 天前
人工智能·机器人·自动驾驶
改进型深度Q-网格DQN和蒙特卡洛树搜索MCTS以及模型预测控制MPC强化学习的机器人室内导航仿真1、源码安装: # 安装 TurtleBot3 的仿真包和导航包PS:千万不要去 GitHub 克隆源码编译!直接用 apt 装官方打包好的,兼容性最好。
田里的水稻2 天前
人工智能·数学建模·机器人·自动驾驶
FA_拟合和插值(FI)-逼近样条03(准均匀B样条的计算)B 样条基函数递推推导(5 控制点准均匀):一阶→二阶→三阶 本文以5 个控制顶点为核心设定,采用工程最常用的准均匀夹紧节点向量,严格遵循德布尔-考克斯递推公式,从一阶基函数(k=2) 逐步推导二阶(k=3)、三阶(k=4) 基函数,全程包含公式定义、节点代入、分区间化简、数值验证,每一步推导可落地、可复现,最终还会验证基函数的核心性质(单位分解性)。
退休钓鱼选手2 天前
c++·人工智能·自动驾驶
[CommonAPI + vsomeip]通信 客户端 5实现了服务端,再实现一个客户端客户端通过绑定状态改变回调去获取服务端的值改变通过参数区分server和client的不同代码
loui robot3 天前
人工智能·算法·自动驾驶
规划与控制之局部路径规划算法local_planner思考问题: 1、当前目标点如何不断更新?按距离?如果存在动态障碍物占据全局路径该如何设置? 2、刹车距离如何预留?
田里的水稻3 天前
数学建模·自动驾驶·几何学
FA_拟合和插值(FI,fitting_and_interpolation)-逼近样条02(多阶贝塞尔曲线)贝塞尔曲线是由伯恩斯坦基函数定义的参数化多项式曲线,核心由控制顶点决定形状,阶数与控制顶点数满足顶点数 = 阶数 + 1:一次(2 个顶点)、二次(3 个顶点)、三次(4 个顶点)。三者的复杂度、光滑性、造型能力依次提升,是 UI 设计、图形学、动画路径等领域的基础,一次为直线(无曲率),二次为抛物线(单曲率),三次为自由曲线(可实现拐点 / 复杂曲率)。本文将分别详细描述各阶贝塞尔曲线的数学定义、几何特性、核心性质,并提供Python 可运行代码(基于matplotlib+numpy),实现曲线 + 控