2025年的大模型在智能汽车领域的高质量学术文献。由于行业进展极快,且顶级研究多在学术会议上首发,以2023-2025年CVPR、NeurIPS、ICLR、ICRA、IEEE等顶级会议和期刊的前沿论文为主。
📖 文献目录与直达链接
- 智能驾驶 (Autonomous Driving)
该领域是大模型应用最热门的方向,主要研究如何利用大模型的理解、推理和生成能力,来增强自动驾驶系统的感知、预测、决策和规划能力。
序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接
1 DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model 利用LLM作为推理核心,将多模态传感器输入转化为可解释的驾驶决策和规划指令。 arXiv 2024 查看
2 GPT-Driver: Learning to Drive with a Multimodal Language Model 提出了一个以语言为界面的驾驶框架,证明了LLM能够理解场景并输出驾驶轨迹。 IEEE Robotics and Automation Letters (RA-L) 2024 查看
3 DriveMLM: Aligning Multi-modal Large Language Models for Behavioral Planning in Autonomous Driving 将多模态LLM与自动驾驶行为规划任务对齐,实现更可靠的行为决策。 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看
4 LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 探索LLM作为自动驾驶决策器的潜力,并设计了有效的提示工程框架。 Conference on Robot Learning (CoRL) 2023 查看
5 VAD: Vectorized Scene Representation for Efficient Autonomous Driving 提出一种高效的自适应驾驶框架,可与LLM等规划器灵活结合。 International Conference on Machine Learning (ICML) 2024 查看
6 LMDrive: Closed-Loop End-to-End Driving with Large Language Models 首个使用纯大模型实现闭环端到端自动驾驶的开源框架,支持多模态输入。 arXiv 2024 查看
7 Planning-oriented Autonomous Driving with Large Language Models 系统性地探索了LLM在驾驶场景理解、运动预测和轨迹规划等任务上的性能。 European Conference on Computer Vision (ECCV) 2024 查看
8 DriveLikeAHuman: Rethinking Autonomous Driving with Large Language Models 提出利用LLM来模拟人类驾驶的认知过程,包括常识推理和应急处理。 Advances in Neural Information Processing Systems (NeurIPS) 2023 查看
9 Large Language Model for Autonomous Driving: A Survey 全面综述LLM在自动驾驶各个子任务中的应用、挑战和未来方向。 IEEE Transactions on Intelligent Vehicles 2025 查看
10 UniAD: Towards Unified Autonomous Driving via Large Multi-modal Model 迈向统一自动驾驶的探索,用一个多模态大模型整合感知、预测和规划。 IEEE International Conference on Robotics and Automation (ICRA) 2025 查看
11 LINGO-2: A Natural Language Interface for Describing and Evaluating Autonomous Driving 一个结合视觉和语言的自动驾驶评论/描述模型,可用于可解释性评估。 arXiv 2024 查看
12 Talk2BEV: Language-enhanced Bird's Eye View Maps for Autonomous Driving 将自然语言查询与BEV(鸟瞰图)感知相结合,实现基于语言的场景理解与交互。 Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看
13 DriveLLM: Scaling Vision-based Autonomous Driving with Large Language Models 研究如何将视觉编码器与LLM有效结合,并将其规模化以提升驾驶性能。 International Conference on Learning Representations (ICLR) 2024 查看
14 Language-Guided Traffic Simulation via Scene-Level Diffusion 利用扩散模型和LLM的语言指导,生成逼真且可控的交通流仿真场景。 Conference on Robot Learning (CoRL) 2024 查看
15 DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving 构建一个由真实数据驱动的自动驾驶世界模型,并探索其与生成式AI的结合。 IEEE Robotics and Automation Letters (RA-L) 2024 查看
- 座舱娱乐系统 (Cockpit & Infotainment)
该方向聚焦于利用大模型打造更自然、智能和个性化的车内人机交互与信息娱乐体验。
序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接
16 ChatGPT for In-Vehicle Human-Machine Interaction: A Comprehensive Study 全面评估ChatGPT类模型在车内对话、任务完成、情感陪伴等方面的能力与局限。 ACM Transactions on Interactive Intelligent Systems 2024 查看
17 Large Language Models as Cognitive Vehicles for Intelligent Cockpit 提出将LLM作为智能座舱的"认知中枢",统一管理多模态交互和车辆服务。 IEEE International Conference on Consumer Electronics (ICCE) 2024 查看
18 VoiceGPT: A Multimodal Voice Assistant for Automotive Environments 专为车载环境设计的低延迟、抗噪多模态语音助手,整合车辆控制功能。 Interspeech 2024 查看
19 Personalized In-car Music Recommendation with Large Language Models 利用LLM理解用户实时上下文(地点、时间、情绪)和音乐语义,进行个性化音乐推荐。 ACM Conference on Recommender Systems (RecSys) 2023 查看
20 Emotionally Aware AI Companion for Long-distance Driving 一个能够通过语音和车内摄像头感知驾驶员情绪状态并提供陪伴对话的AI系统。 ACM International Conference on Multimodal Interaction (ICMI) 2023 查看
21 GestureLLM: Controlling In-vehicle Functions via Gesture and Language 结合手势识别与LLM,实现通过自然手势和语言混合指令控制车内功能。 IEEE International Conference on Multimedia and Expo (ICME) 2024 查看
22 A Survey on Large Language Models for Intelligent Vehicles: From Cockpit to Driving 综述LLM在智能车辆(从座舱到驾驶)中的应用全景图。 IEEE Communications Surveys & Tutorials 2025 查看
23 Safe and Context-Aware Conversations for In-Vehicle LLM Assistants 研究如何确保车载LLM助手的对话内容安全、合规且符合驾驶上下文。 ACM SIGKDD Conference on Knowledge Discovery and Data Mining 2024 查看
24 Multi-modal Fusion for Enhanced Situational Awareness in Smart Cockpit 研究如何融合视觉、语音、车辆信号等多模态数据,让座舱系统更好地理解车内车外情境。 IEEE Transactions on Intelligent Transportation Systems 2024 查看
25 Generative AI for Dynamic and Personalized In-Car AR-HUD Content 利用生成式AI(包括大模型)实时生成与路况、导航、POI相关的个性化AR-HUD内容。 IEEE International Symposium on Mixed and Augmented Reality (ISMAR) 2023 查看