技术栈
多模态多任务大模型
婷小主的保镖的学习日记
1 个月前
多模态多任务大模型
视觉多模态多任务统一大模型(一些思考)
1、传统的单一任务模型难以满足开放世界场景下的多任务、多模态需求; 2、面对现实世界,模型需要具备在未知场景中进行有效推理能力; 3、人工智能的主要目标是开发一个通用的模型,能够遵循多模态指令,满足人类的意图在真实环境中完成各种任务; 4、chatgpt4等大模型已经证明LLM具备遵循人类指令的能力;