智能汽车-大模型应用文献

2025年的大模型在智能汽车领域的高质量学术文献。由于行业进展极快,且顶级研究多在学术会议上首发,以2023-2025年CVPR、NeurIPS、ICLR、ICRA、IEEE等顶级会议和期刊的前沿论文为主。

📖 文献目录与直达链接

  1. 智能驾驶 (Autonomous Driving)

该领域是大模型应用最热门的方向,主要研究如何利用大模型的理解、推理和生成能力,来增强自动驾驶系统的感知、预测、决策和规划能力。

序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接

1 DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model 利用LLM作为推理核心,将多模态传感器输入转化为可解释的驾驶决策和规划指令。 arXiv 2024 查看

2 GPT-Driver: Learning to Drive with a Multimodal Language Model 提出了一个以语言为界面的驾驶框架,证明了LLM能够理解场景并输出驾驶轨迹。 IEEE Robotics and Automation Letters (RA-L) 2024 查看

3 DriveMLM: Aligning Multi-modal Large Language Models for Behavioral Planning in Autonomous Driving 将多模态LLM与自动驾驶行为规划任务对齐,实现更可靠的行为决策。 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看

4 LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 探索LLM作为自动驾驶决策器的潜力,并设计了有效的提示工程框架。 Conference on Robot Learning (CoRL) 2023 查看

5 VAD: Vectorized Scene Representation for Efficient Autonomous Driving 提出一种高效的自适应驾驶框架,可与LLM等规划器灵活结合。 International Conference on Machine Learning (ICML) 2024 查看

6 LMDrive: Closed-Loop End-to-End Driving with Large Language Models 首个使用纯大模型实现闭环端到端自动驾驶的开源框架,支持多模态输入。 arXiv 2024 查看

7 Planning-oriented Autonomous Driving with Large Language Models 系统性地探索了LLM在驾驶场景理解、运动预测和轨迹规划等任务上的性能。 European Conference on Computer Vision (ECCV) 2024 查看

8 DriveLikeAHuman: Rethinking Autonomous Driving with Large Language Models 提出利用LLM来模拟人类驾驶的认知过程,包括常识推理和应急处理。 Advances in Neural Information Processing Systems (NeurIPS) 2023 查看

9 Large Language Model for Autonomous Driving: A Survey 全面综述LLM在自动驾驶各个子任务中的应用、挑战和未来方向。 IEEE Transactions on Intelligent Vehicles 2025 查看

10 UniAD: Towards Unified Autonomous Driving via Large Multi-modal Model 迈向统一自动驾驶的探索,用一个多模态大模型整合感知、预测和规划。 IEEE International Conference on Robotics and Automation (ICRA) 2025 查看

11 LINGO-2: A Natural Language Interface for Describing and Evaluating Autonomous Driving 一个结合视觉和语言的自动驾驶评论/描述模型,可用于可解释性评估。 arXiv 2024 查看

12 Talk2BEV: Language-enhanced Bird's Eye View Maps for Autonomous Driving 将自然语言查询与BEV(鸟瞰图)感知相结合,实现基于语言的场景理解与交互。 Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看

13 DriveLLM: Scaling Vision-based Autonomous Driving with Large Language Models 研究如何将视觉编码器与LLM有效结合,并将其规模化以提升驾驶性能。 International Conference on Learning Representations (ICLR) 2024 查看

14 Language-Guided Traffic Simulation via Scene-Level Diffusion 利用扩散模型和LLM的语言指导,生成逼真且可控的交通流仿真场景。 Conference on Robot Learning (CoRL) 2024 查看

15 DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving 构建一个由真实数据驱动的自动驾驶世界模型,并探索其与生成式AI的结合。 IEEE Robotics and Automation Letters (RA-L) 2024 查看

  1. 座舱娱乐系统 (Cockpit & Infotainment)

该方向聚焦于利用大模型打造更自然、智能和个性化的车内人机交互与信息娱乐体验。

序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接

16 ChatGPT for In-Vehicle Human-Machine Interaction: A Comprehensive Study 全面评估ChatGPT类模型在车内对话、任务完成、情感陪伴等方面的能力与局限。 ACM Transactions on Interactive Intelligent Systems 2024 查看

17 Large Language Models as Cognitive Vehicles for Intelligent Cockpit 提出将LLM作为智能座舱的"认知中枢",统一管理多模态交互和车辆服务。 IEEE International Conference on Consumer Electronics (ICCE) 2024 查看

18 VoiceGPT: A Multimodal Voice Assistant for Automotive Environments 专为车载环境设计的低延迟、抗噪多模态语音助手,整合车辆控制功能。 Interspeech 2024 查看

19 Personalized In-car Music Recommendation with Large Language Models 利用LLM理解用户实时上下文(地点、时间、情绪)和音乐语义,进行个性化音乐推荐。 ACM Conference on Recommender Systems (RecSys) 2023 查看

20 Emotionally Aware AI Companion for Long-distance Driving 一个能够通过语音和车内摄像头感知驾驶员情绪状态并提供陪伴对话的AI系统。 ACM International Conference on Multimodal Interaction (ICMI) 2023 查看

21 GestureLLM: Controlling In-vehicle Functions via Gesture and Language 结合手势识别与LLM,实现通过自然手势和语言混合指令控制车内功能。 IEEE International Conference on Multimedia and Expo (ICME) 2024 查看

22 A Survey on Large Language Models for Intelligent Vehicles: From Cockpit to Driving 综述LLM在智能车辆(从座舱到驾驶)中的应用全景图。 IEEE Communications Surveys & Tutorials 2025 查看

23 Safe and Context-Aware Conversations for In-Vehicle LLM Assistants 研究如何确保车载LLM助手的对话内容安全、合规且符合驾驶上下文。 ACM SIGKDD Conference on Knowledge Discovery and Data Mining 2024 查看

24 Multi-modal Fusion for Enhanced Situational Awareness in Smart Cockpit 研究如何融合视觉、语音、车辆信号等多模态数据,让座舱系统更好地理解车内车外情境。 IEEE Transactions on Intelligent Transportation Systems 2024 查看

25 Generative AI for Dynamic and Personalized In-Car AR-HUD Content 利用生成式AI(包括大模型)实时生成与路况、导航、POI相关的个性化AR-HUD内容。 IEEE International Symposium on Mixed and Augmented Reality (ISMAR) 2023 查看

相关推荐
Piar1231sdafa2 小时前
野猪目标检测与识别_基于YOLO11-Attention模型的改进实现
人工智能·目标检测·计算机视觉
光羽隹衡2 小时前
计算机视觉——Opencv(基础操作二)
人工智能·opencv·计算机视觉
一路向阳~负责的男人2 小时前
PyTorch / CUDA 是什么?它们的关系?
人工智能·pytorch·python
2501_941333102 小时前
乒乓球比赛场景目标检测与行为分析研究
人工智能·目标检测·计算机视觉
岑梓铭2 小时前
YOLO深度学习(计算机视觉)一很有用!!(进一步加快训练速度的操作)
人工智能·深度学习·神经网络·yolo·计算机视觉
2401_841495642 小时前
深度卷积生成对抗网络(DCGAN)
人工智能·python·深度学习·神经网络·机器学习·生成对抗网络·深度卷积生成对抗网络
byzh_rc2 小时前
[深度学习网络从入门到入土] 反向传播backprop
网络·人工智能·深度学习
BOLD-Rainbow2 小时前
DCRNN (Diffusion Convolutional Recurrent Neural Network)
人工智能·深度学习·机器学习
zhangfeng11333 小时前
如何用小内存电脑训练大数据的bpe,16g内存训练200g数据集默认是一次性读入内存训练
大数据·人工智能