技术栈
视频问答
AI记忆
5 个月前
aigc
·
音视频
·
多模态
·
视频理解
·
视频问答
视频与音频的交响:探索达摩院VideoLLaMA 2的技术创新
文章:https://arxiv.org/abs/2406.07476代码:https://github.com/DAMO-NLP-SG/VideoLLaMA2