技术栈

多模态通用模型

m0_65010824
7 小时前
计算机视觉·论文精读·视觉理解·视觉生成·多模态通用模型·视觉分割·视觉编辑
【论文精读】VITRON:统一的像素级视觉大语言模型标题:VITRON: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing
我是有底线的