技术栈

强化微调

Catching Star
10 小时前
论文阅读·强化微调
【论文笔记】【强化微调】TinyLLaVA-Video-R1:小参数模型也能视频推理[2504.09641] TinyLLaVA-Video-R1: Towards Smaller LMMs for Video Reasoning
温柔哥`
22 天前
vad·var·视频异常检测·grpo·视频异常推理·推理数据集·强化微调
Vad-R1:通过从感知到认知的思维链进行视频异常推理Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought ¹中山大学深圳校区;²哈尔滨工业大学(深圳);³香港理工大学 arxiv’25’05