MovieNet (paper) :推动电影理解研究的综合数据集与基准MovieNet是由香港中文大学等机构联合构建的、面向 holistic 电影理解的综合性多模态数据集。针对现有数据集在规模和多模态标注上的局限,MovieNet以其海量数据与丰富标注,为从低层视觉到高层语义的电影理解研究提供了坚实基础。 该数据集核心包含1,100部完整电影、3.9M张图片、60K条预告片以及海量剧本、字幕、剧情梗概和元数据。更重要的是,MovieNet提供了全方位的人工标注:包括110万个人物边界框与身份、4.2万个场景边界、6.5万个动作/场景标签以及9.2万个电影风格标签,并首次手