技术栈
视觉多模态
皇族崛起
4 小时前
人工智能
·
python
·
计算机视觉
·
图文多模态
·
视觉多模态
【视觉多模态】基于视觉AI的人物轨迹生成方案
基于 Yolo-World v2 把人物从视频每帧中提取出来并分别存储在某路径下。现在的下一步,应该是把这些截图全部转换为向量并存储到向量数据库。
我是有底线的