技术栈
视觉生成
AI生成未来
10 天前
计算机视觉
·
aigc
·
多模态
·
思维链
·
视觉生成
北交&字节最新开源ThinkGen:首次显式利用多模态CoT处理生成任务,多项任务性能SOTA
论文链接:https://arxiv.org/pdf/2512.23568 项目链接:https://github.com/jiaosiyuu/ThinkGen HF 链接:https://huggingface.co/JSYuuu/ThinkGen
m0_65010824
3 个月前
计算机视觉
·
论文精读
·
视觉理解
·
视觉生成
·
多模态通用模型
·
视觉分割
·
视觉编辑
【论文精读】VITRON:统一的像素级视觉大语言模型
标题:VITRON: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, Editing
youcans_
1 年前
人工智能
·
计算机视觉
·
大语言模型
·
多模态
·
视觉生成
【微软:多模态基础模型】(3)视觉生成
欢迎关注【youcans的AGI学习笔记】原创作品 【微软:多模态基础模型】(1)从专家到通用助手 【微软:多模态基础模型】(2)视觉理解 【微软:多模态基础模型】(3)视觉生成 【微软:多模态基础模型】(4)统一视觉模型
我是有底线的