技术栈
解码多模态
彼得虫
6 小时前
深度学习
·
解码多模态
【BLIP】解读BLIP
BLIP,全称是Bootstrapped Language-Image Pretraining,源自《BLIP: Bootstrapping Language-Image Pre-training for Unifified Vision-Language Understanding and Generation》这篇文章,是来自Salesforce Research的一个多模态模型。