智能汽车-大模型应用文献

2025年的大模型在智能汽车领域的高质量学术文献。由于行业进展极快,且顶级研究多在学术会议上首发,以2023-2025年CVPR、NeurIPS、ICLR、ICRA、IEEE等顶级会议和期刊的前沿论文为主。

📖 文献目录与直达链接

  1. 智能驾驶 (Autonomous Driving)

该领域是大模型应用最热门的方向,主要研究如何利用大模型的理解、推理和生成能力,来增强自动驾驶系统的感知、预测、决策和规划能力。

序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接

1 DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model 利用LLM作为推理核心,将多模态传感器输入转化为可解释的驾驶决策和规划指令。 arXiv 2024 查看

2 GPT-Driver: Learning to Drive with a Multimodal Language Model 提出了一个以语言为界面的驾驶框架,证明了LLM能够理解场景并输出驾驶轨迹。 IEEE Robotics and Automation Letters (RA-L) 2024 查看

3 DriveMLM: Aligning Multi-modal Large Language Models for Behavioral Planning in Autonomous Driving 将多模态LLM与自动驾驶行为规划任务对齐,实现更可靠的行为决策。 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看

4 LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving 探索LLM作为自动驾驶决策器的潜力,并设计了有效的提示工程框架。 Conference on Robot Learning (CoRL) 2023 查看

5 VAD: Vectorized Scene Representation for Efficient Autonomous Driving 提出一种高效的自适应驾驶框架,可与LLM等规划器灵活结合。 International Conference on Machine Learning (ICML) 2024 查看

6 LMDrive: Closed-Loop End-to-End Driving with Large Language Models 首个使用纯大模型实现闭环端到端自动驾驶的开源框架,支持多模态输入。 arXiv 2024 查看

7 Planning-oriented Autonomous Driving with Large Language Models 系统性地探索了LLM在驾驶场景理解、运动预测和轨迹规划等任务上的性能。 European Conference on Computer Vision (ECCV) 2024 查看

8 DriveLikeAHuman: Rethinking Autonomous Driving with Large Language Models 提出利用LLM来模拟人类驾驶的认知过程,包括常识推理和应急处理。 Advances in Neural Information Processing Systems (NeurIPS) 2023 查看

9 Large Language Model for Autonomous Driving: A Survey 全面综述LLM在自动驾驶各个子任务中的应用、挑战和未来方向。 IEEE Transactions on Intelligent Vehicles 2025 查看

10 UniAD: Towards Unified Autonomous Driving via Large Multi-modal Model 迈向统一自动驾驶的探索,用一个多模态大模型整合感知、预测和规划。 IEEE International Conference on Robotics and Automation (ICRA) 2025 查看

11 LINGO-2: A Natural Language Interface for Describing and Evaluating Autonomous Driving 一个结合视觉和语言的自动驾驶评论/描述模型,可用于可解释性评估。 arXiv 2024 查看

12 Talk2BEV: Language-enhanced Bird's Eye View Maps for Autonomous Driving 将自然语言查询与BEV(鸟瞰图)感知相结合,实现基于语言的场景理解与交互。 Conference on Computer Vision and Pattern Recognition (CVPR) 2024 查看

13 DriveLLM: Scaling Vision-based Autonomous Driving with Large Language Models 研究如何将视觉编码器与LLM有效结合,并将其规模化以提升驾驶性能。 International Conference on Learning Representations (ICLR) 2024 查看

14 Language-Guided Traffic Simulation via Scene-Level Diffusion 利用扩散模型和LLM的语言指导,生成逼真且可控的交通流仿真场景。 Conference on Robot Learning (CoRL) 2024 查看

15 DriveDreamer: Towards Real-world-driven World Models for Autonomous Driving 构建一个由真实数据驱动的自动驾驶世界模型,并探索其与生成式AI的结合。 IEEE Robotics and Automation Letters (RA-L) 2024 查看

  1. 座舱娱乐系统 (Cockpit & Infotainment)

该方向聚焦于利用大模型打造更自然、智能和个性化的车内人机交互与信息娱乐体验。

序号 论文标题 关键贡献/简介 来源/会议/期刊 年份 链接

16 ChatGPT for In-Vehicle Human-Machine Interaction: A Comprehensive Study 全面评估ChatGPT类模型在车内对话、任务完成、情感陪伴等方面的能力与局限。 ACM Transactions on Interactive Intelligent Systems 2024 查看

17 Large Language Models as Cognitive Vehicles for Intelligent Cockpit 提出将LLM作为智能座舱的"认知中枢",统一管理多模态交互和车辆服务。 IEEE International Conference on Consumer Electronics (ICCE) 2024 查看

18 VoiceGPT: A Multimodal Voice Assistant for Automotive Environments 专为车载环境设计的低延迟、抗噪多模态语音助手,整合车辆控制功能。 Interspeech 2024 查看

19 Personalized In-car Music Recommendation with Large Language Models 利用LLM理解用户实时上下文(地点、时间、情绪)和音乐语义,进行个性化音乐推荐。 ACM Conference on Recommender Systems (RecSys) 2023 查看

20 Emotionally Aware AI Companion for Long-distance Driving 一个能够通过语音和车内摄像头感知驾驶员情绪状态并提供陪伴对话的AI系统。 ACM International Conference on Multimodal Interaction (ICMI) 2023 查看

21 GestureLLM: Controlling In-vehicle Functions via Gesture and Language 结合手势识别与LLM,实现通过自然手势和语言混合指令控制车内功能。 IEEE International Conference on Multimedia and Expo (ICME) 2024 查看

22 A Survey on Large Language Models for Intelligent Vehicles: From Cockpit to Driving 综述LLM在智能车辆(从座舱到驾驶)中的应用全景图。 IEEE Communications Surveys & Tutorials 2025 查看

23 Safe and Context-Aware Conversations for In-Vehicle LLM Assistants 研究如何确保车载LLM助手的对话内容安全、合规且符合驾驶上下文。 ACM SIGKDD Conference on Knowledge Discovery and Data Mining 2024 查看

24 Multi-modal Fusion for Enhanced Situational Awareness in Smart Cockpit 研究如何融合视觉、语音、车辆信号等多模态数据,让座舱系统更好地理解车内车外情境。 IEEE Transactions on Intelligent Transportation Systems 2024 查看

25 Generative AI for Dynamic and Personalized In-Car AR-HUD Content 利用生成式AI(包括大模型)实时生成与路况、导航、POI相关的个性化AR-HUD内容。 IEEE International Symposium on Mixed and Augmented Reality (ISMAR) 2023 查看

相关推荐
AEIC学术交流中心几秒前
【快速EI检索 | SPIE出版】2026年量子计算与人工智能国际学术会议(ICQCAI 2026)
人工智能·量子计算
沪漂阿龙3 分钟前
PyTorch 深度学习完全指南:从激活函数到房价预测实战
人工智能·pytorch·深度学习
云边云科技_云网融合3 分钟前
网关接入异常监测预警:从固定阈值到 AI 动态感知的技术革新
运维·服务器·网络·人工智能
Chef_Chen3 分钟前
Agent学习-RAG--上下文压缩与知识库的更新
人工智能·学习·自然语言处理
fundoit4 分钟前
MySQL问题收集
数据库·人工智能·mysql·智能体
人工智能交叉前沿技术,6 分钟前
流固耦合与深度学习
人工智能·深度学习
广州创科水利11 分钟前
智慧赋能,守护安澜—广州创科助力五华县37宗水库安全监测
大数据·人工智能·安全
见行AGV机器人11 分钟前
本质安全型防爆AGV
人工智能·安全·agv·非标定制agv·agv控制器·麦轮agv
guslegend14 分钟前
第4节:切片语义割裂怎么办?
人工智能·大模型·rag
芝士爱知识a15 分钟前
【深度解析】当人工智能遇见当代艺术:探索 Dynamic Art Award (DAA) 动态艺术奖的科技与创意之美
人工智能·科技