技术栈

多模态理解

阿杰学AI
15 天前
人工智能·ai·语言模型·自然语言处理·aigc·embedding·多模态理解
AI核心知识31——大语言模型之Multimodal Understanding(简洁且通俗易懂版)多模态理解 (Multimodal Understanding) 是多模态技术中侧重于 “输入” 和 “感知” 的那一面。
datamonday
10 个月前
人工智能·llm·图像生成·deepseek·多模态理解
[EAI-031] DeepSeek 的 Janus-Pro,统一的多模态理解和生成模型论文标题:Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling 论文作者:Xiaokang Chen, Zhiyu Wu, Xingchao Liu, Zizheng Pan, Wen Liu, Zhenda Xie, Xingkai Yu, Chong Ruan 论文链接:https://arxiv.org/abs/2501.17811v1 项目主页:https://github.co
我是有底线的