技术栈
多模态通用模型
m0_65010824
7 小时前
计算机视觉
·
论文精读
·
视觉理解
·
视觉生成
·
多模态通用模型
·
视觉分割
·
视觉编辑
【论文精读】VITRON:统一的像素级视觉大语言模型
标题:VITRON: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing
我是有底线的