智能汽车-大模型应用文献

2025年的大模型在智能汽车领域的高质量学术文献。由于行业进展极快,且顶级研究多在学术会议上首发,以2023-2025年CVPR、NeurIPS、ICLR、ICRA、IEEE等顶级会议和期刊的前沿论文为主。

📖 文献目录与直达链接

  1. 智能驾驶 (Autonomous Driving)

该领域是大模型应用最热门的方向,主要研究如何利用大模型的理解、推理和生成能力,来增强自动驾驶系统的感知、预测、决策和规划能力。

序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接

1 DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model 利用LLM作为推理核心,将多模态传感器输入转化为可解释的驾驶决策和规划指令。 arXiv 2024 查看

2 GPT-Driver: Learning to Drive with a Multimodal Language Model 提出了一个以语言为界面的驾驶框架,证明了LLM能够理解场景并输出驾驶轨迹。 IEEE Robotics and Automation Letters (RA-L) 2024 查看

3 DriveMLM: Aligning Multi-modal Large Language Models for Behavioral Planning in Autonomous Driving 将多模态LLM与自动驾驶行为规划任务对齐,实现更可靠的行为决策。 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看

4 LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 探索LLM作为自动驾驶决策器的潜力,并设计了有效的提示工程框架。 Conference on Robot Learning (CoRL) 2023 查看

5 VAD: Vectorized Scene Representation for Efficient Autonomous Driving 提出一种高效的自适应驾驶框架,可与LLM等规划器灵活结合。 International Conference on Machine Learning (ICML) 2024 查看

6 LMDrive: Closed-Loop End-to-End Driving with Large Language Models 首个使用纯大模型实现闭环端到端自动驾驶的开源框架,支持多模态输入。 arXiv 2024 查看

7 Planning-oriented Autonomous Driving with Large Language Models 系统性地探索了LLM在驾驶场景理解、运动预测和轨迹规划等任务上的性能。 European Conference on Computer Vision (ECCV) 2024 查看

8 DriveLikeAHuman: Rethinking Autonomous Driving with Large Language Models 提出利用LLM来模拟人类驾驶的认知过程,包括常识推理和应急处理。 Advances in Neural Information Processing Systems (NeurIPS) 2023 查看

9 Large Language Model for Autonomous Driving: A Survey 全面综述LLM在自动驾驶各个子任务中的应用、挑战和未来方向。 IEEE Transactions on Intelligent Vehicles 2025 查看

10 UniAD: Towards Unified Autonomous Driving via Large Multi-modal Model 迈向统一自动驾驶的探索,用一个多模态大模型整合感知、预测和规划。 IEEE International Conference on Robotics and Automation (ICRA) 2025 查看

11 LINGO-2: A Natural Language Interface for Describing and Evaluating Autonomous Driving 一个结合视觉和语言的自动驾驶评论/描述模型,可用于可解释性评估。 arXiv 2024 查看

12 Talk2BEV: Language-enhanced Bird's Eye View Maps for Autonomous Driving 将自然语言查询与BEV(鸟瞰图)感知相结合,实现基于语言的场景理解与交互。 Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看

13 DriveLLM: Scaling Vision-based Autonomous Driving with Large Language Models 研究如何将视觉编码器与LLM有效结合,并将其规模化以提升驾驶性能。 International Conference on Learning Representations (ICLR) 2024 查看

14 Language-Guided Traffic Simulation via Scene-Level Diffusion 利用扩散模型和LLM的语言指导,生成逼真且可控的交通流仿真场景。 Conference on Robot Learning (CoRL) 2024 查看

15 DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving 构建一个由真实数据驱动的自动驾驶世界模型,并探索其与生成式AI的结合。 IEEE Robotics and Automation Letters (RA-L) 2024 查看

  1. 座舱娱乐系统 (Cockpit & Infotainment)

该方向聚焦于利用大模型打造更自然、智能和个性化的车内人机交互与信息娱乐体验。

序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接

16 ChatGPT for In-Vehicle Human-Machine Interaction: A Comprehensive Study 全面评估ChatGPT类模型在车内对话、任务完成、情感陪伴等方面的能力与局限。 ACM Transactions on Interactive Intelligent Systems 2024 查看

17 Large Language Models as Cognitive Vehicles for Intelligent Cockpit 提出将LLM作为智能座舱的"认知中枢",统一管理多模态交互和车辆服务。 IEEE International Conference on Consumer Electronics (ICCE) 2024 查看

18 VoiceGPT: A Multimodal Voice Assistant for Automotive Environments 专为车载环境设计的低延迟、抗噪多模态语音助手,整合车辆控制功能。 Interspeech 2024 查看

19 Personalized In-car Music Recommendation with Large Language Models 利用LLM理解用户实时上下文(地点、时间、情绪)和音乐语义,进行个性化音乐推荐。 ACM Conference on Recommender Systems (RecSys) 2023 查看

20 Emotionally Aware AI Companion for Long-distance Driving 一个能够通过语音和车内摄像头感知驾驶员情绪状态并提供陪伴对话的AI系统。 ACM International Conference on Multimodal Interaction (ICMI) 2023 查看

21 GestureLLM: Controlling In-vehicle Functions via Gesture and Language 结合手势识别与LLM,实现通过自然手势和语言混合指令控制车内功能。 IEEE International Conference on Multimedia and Expo (ICME) 2024 查看

22 A Survey on Large Language Models for Intelligent Vehicles: From Cockpit to Driving 综述LLM在智能车辆(从座舱到驾驶)中的应用全景图。 IEEE Communications Surveys & Tutorials 2025 查看

23 Safe and Context-Aware Conversations for In-Vehicle LLM Assistants 研究如何确保车载LLM助手的对话内容安全、合规且符合驾驶上下文。 ACM SIGKDD Conference on Knowledge Discovery and Data Mining 2024 查看

24 Multi-modal Fusion for Enhanced Situational Awareness in Smart Cockpit 研究如何融合视觉、语音、车辆信号等多模态数据,让座舱系统更好地理解车内车外情境。 IEEE Transactions on Intelligent Transportation Systems 2024 查看

25 Generative AI for Dynamic and Personalized In-Car AR-HUD Content 利用生成式AI(包括大模型)实时生成与路况、导航、POI相关的个性化AR-HUD内容。 IEEE International Symposium on Mixed and Augmented Reality (ISMAR) 2023 查看

相关推荐
SEO_juper5 分钟前
13个不容错过的SEO技巧,让您的网站可见度飙升
人工智能·seo·数字营销
小瑞瑞acd6 分钟前
【小瑞瑞精讲】卷积神经网络(CNN):从入门到精通,计算机如何“看”懂世界?
人工智能·python·深度学习·神经网络·机器学习
CoderJia程序员甲16 分钟前
GitHub 热榜项目 - 日榜(2026-02-06)
人工智能·ai·大模型·github·ai教程
wukangjupingbb20 分钟前
AI多模态技术在创新药研发中的结合路径、机制及挑战
人工智能
CoderIsArt31 分钟前
三大主流智能体框架解析
人工智能
民乐团扒谱机35 分钟前
【微实验】机器学习之集成学习 GBDT和XGBoost 附 matlab仿真代码 复制即可运行
人工智能·机器学习·matlab·集成学习·xgboost·gbdt·梯度提升树
Coder_Boy_37 分钟前
Deeplearning4j+ Spring Boot 电商用户复购预测案例中相关概念
java·人工智能·spring boot·后端·spring
芷栀夏40 分钟前
CANN ops-math:揭秘异构计算架构下数学算子的低延迟高吞吐优化逻辑
人工智能·深度学习·神经网络·cann
L5434144641 分钟前
告别代码堆砌匠厂架构让你的系统吞吐量翻倍提升
大数据·人工智能·架构·自动化·rpa
孤狼warrior42 分钟前
YOLO目标检测 一千字解析yolo最初的摸样 模型下载,数据集构建及模型训练代码
人工智能·python·深度学习·算法·yolo·目标检测·目标跟踪