KDD 2025 | 地理定位中的群体智能:一个多智能体大型视觉语言模型协同框架今天跟大家分享一篇被KDD 25录用的多模态大模型智能体协同框架,该文章提出了一种多智能体大模型协作机制以及一种大模型智能体之间关系的动态学习策略,有效减少了大模型智能体之间冗余的交互次数,从而提高了系统的地理定位效率。具体而言,该论文参考审稿机制与流程来尽最大可能发挥不同大模型智能体对于不同地标的定位能力。同时,根据不同图像定位请求,自适应生成智能体社交网络结构,来规划哪些智能体之间的讨论可以产生对准确定位图像产生正面促进作用的结果。提出的框架在3个数据集上的实验表明,该框架表现显著优于其他目前最先进的