【LLM】文生视频相关开源数据集(VidGen、Panda、Cogvideox等)(1)VidGen数据集:vidgen-1M利用了来自HD-VILA数据集的380万高分辨率、长时段视频。随后,这些视频被分割成1.08亿个视频片段。接下来,本文对这些视频片段进行了标注和采样。然后,使用VILA模型进行视频字幕生成 论文链接:https://arxiv.org/pdf/2408.02629 项目链接:https://sais-fuxi.github.io/projects/vidgen-1m/ git链接:https://github.com/SAIS-FUXI/VidGen