技术栈
token压缩
山顶夕景
4 小时前
vlm
·
rope
·
视频理解
·
多模态理解
·
长视频
·
token压缩
【VLM】视频理解LLaVA-OneVision-2(Codec-stream)
链接:https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-2
我是有底线的