图文多模态 - 图文多模态技术,学习,经验文章

皇族崛起

6 个月前

【视觉多模态】基于视觉AI的人物轨迹生成方案基于 Yolo-World v2 把人物从视频每帧中提取出来并分别存储在某路径下。现在的下一步，应该是把这些截图全部转换为向量并存储到向量数据库。