大型视觉语言模型的有效性评估原文地址:https://arxiv.org/abs/2403.04306摘要:大型视觉语言模型(LVLM)的出现代表了通用人工智能的探索取得了显着的进步。然而,该模型在专业和一般任务中的有效性值得进一步研究。本文致力于评估流行的 LVLM 分别在专业任务和一般任务中的能力,旨在提供对这些新颖模型的全面理解。为了衡量它们在专业任务中的有效性,我们在三个不同的应用场景中采用了六项具有挑战性的任务:自然、医疗保健和工业。这六项任务包括显著/伪装/透明物体检测,以及息肉检测、皮肤病变检测和工业异常检测。我们研究