技术栈

视觉生成

m0_65010824
21 天前
计算机视觉·论文精读·视觉理解·视觉生成·多模态通用模型·视觉分割·视觉编辑
【论文精读】VITRON:统一的像素级视觉大语言模型标题:VITRON: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing
youcans_
1 年前
人工智能·计算机视觉·大语言模型·多模态·视觉生成
【微软:多模态基础模型】(3)视觉生成欢迎关注【youcans的AGI学习笔记】原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微软:多模态基础模型】(4)统一视觉模型
我是有底线的