技术栈
mllms
flying_1314
14 天前
llm
·
推荐系统
·
多模态大模型
·
mllms
·
mlrms
·
端到端训练
·
生成式大模型
推荐大模型系列-NoteLLM-2: Multimodal Large Representation Models for Recommendation(三)
目录一、训练细节二、端到端MLRM细节三、Qwen-VL-Chat的显著性分数分析传统MLLMs与MLRMs的适配问题
温柔哥`
1 个月前
大模型
·
agent
·
rag
·
vad
·
视频异常检测
·
工具调用
·
mllms
PANDA:通过代理型 AI 工程师迈向通用视频异常检测
PANDA: Towards Generalist Video Anomaly Detection via Agentic AI Engineer NIPS’25 西安电子科技大学;新加坡国立大学 Show Lab
lovep1
9 个月前
大模型
·
基础模型
·
视频理解
·
mllms
·
internvideo2.5
InternVideo2.5:Empowering Video MLLMs with Long and Rich Context Modeling
MLLM的问题点:MLLM在基本视觉相关任务上的表现仍不如人类,这限制了其理解和推理能力。它们在识别、定位和回忆常见场景中的物体、场景和动作时表现不佳。
AI生成未来
10 个月前
计算机视觉
·
语言模型
·
多模态
·
mllms
多模态大语言模型(MLLMs)如何重塑和变革计算机视觉?
本文介绍了多模态大型语言模型(MLLM)的定义、使用挑战性提示的应用场景,以及正在重塑计算机视觉的顶级模型。
我是有底线的