技术栈

视觉生成

AI生成未来
10 天前
计算机视觉·aigc·多模态·思维链·视觉生成
北交&字节最新开源ThinkGen:首次显式利用多模态CoT处理生成任务,多项任务性能SOTA论文链接:https://arxiv.org/pdf/2512.23568 项目链接:https://github.com/jiaosiyuu/ThinkGen HF 链接:https://huggingface.co/JSYuuu/ThinkGen
m0_65010824
3 个月前
计算机视觉·论文精读·视觉理解·视觉生成·多模态通用模型·视觉分割·视觉编辑
【论文精读】VITRON:统一的像素级视觉大语言模型标题:VITRON: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing
youcans_
1 年前
人工智能·计算机视觉·大语言模型·多模态·视觉生成
【微软:多模态基础模型】(3)视觉生成欢迎关注【youcans的AGI学习笔记】原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微软:多模态基础模型】(4)统一视觉模型
我是有底线的