技术栈
视频理解
疯狂的小强呀
3 个月前
大模型
·
文本生成
·
视频理解
视频理解大模型最新进展
2023:阿里达摩院的一个多模态大语言模型产品论文:https://arxiv.org/abs/2306.02858
伊织code
4 个月前
人工智能
·
大模型
·
llm
·
数据集
·
任务
·
视频理解
·
vid
Awesome-LLMs-for-Video-Understanding - 基于大型语言模型的视频理解研究
Awesome-LLMs-for-Video-Understanding 是 基于大型语言模型的视频理解研究
AI记忆
6 个月前
aigc
·
音视频
·
多模态
·
视频理解
·
视频问答
视频与音频的交响:探索达摩院VideoLLaMA 2的技术创新
文章:https://arxiv.org/abs/2406.07476代码:https://github.com/DAMO-NLP-SG/VideoLLaMA2