多模态大语言模型arxiv论文略读(131)➡️ 论文标题:MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents ➡️ 论文作者:Junpeng Yue, Xinru Xu, Börje F. Karlsson, Zongqing Lu ➡️ 研究机构: 北京大学、中国科学院软件研究所、北京人工智能研究院 ➡️ 问题背景:多模态大型语言模型(MLLMs)在处理复杂具身任务时展现出潜力,通过检索多模态任务相关轨迹数据来完成任务。然而,当前的