技术栈
视频检索
学术菜鸟小晨
2 个月前
视频检索
视频检索技术为电子商务直播领域带来了前所未有的革新
视频检测在这个场景中指的是通过视频流实时识别和检索直播中销售人员展示的商品。这涉及到从连续的视频帧中分析和识别商品的视觉内容,通常与语音和文本数据结合,以提高识别准确性。
FesianXu
1 年前
计算机视觉
·
自然语言处理
·
多模态模型
·
视频检索
【论文极速读】视频检索中的模态均衡方法
传统的视频搜索系统相关性部分主要以文本匹配为基础手段,在其中引入多模态向量容易收到『模态不均衡』的问题,论文[1]尝试对其进行解决,本文进行笔记。如有谬误请见谅并联系指出,本文遵守CC 4.0 BY-SA版权协议,转载请联系作者并注明出处,谢谢。