技术栈

图文多模态

皇族崛起
4 小时前
人工智能·python·计算机视觉·图文多模态·视觉多模态
【视觉多模态】基于视觉AI的人物轨迹生成方案基于 Yolo-World v2 把人物从视频每帧中提取出来并分别存储在某路径下。现在的下一步,应该是把这些截图全部转换为向量并存储到向量数据库。
我是有底线的