技术栈

解码多模态

彼得虫
2 个月前
深度学习·解码多模态
【BLIP】解读BLIPBLIP,全称是Bootstrapped Language-Image Pretraining,源自《BLIP: Bootstrapping Language-Image Pre-training for Unifified Vision-Language Understanding and Generation》这篇文章,是来自Salesforce Research的一个多模态模型。