技术栈

大模型蒸馏

Hali_Botebie
3 小时前
大模型蒸馏
【视觉蒸馏】MLLMs need 3D-aware representation supervision for scene understanding这个论文利用3D 模型监督 LLM 模型,实现LLM性能提升。核心研究的以下问题:(1) 如何评估MLLM学习3D感知表示的能力?(2) 3D特征学习的质量如何影响下游场景理解性能?(3) 什么方法可以增强MLLM框架内的3D感知表示学习?
硅基捕手维克托
3 个月前
大模型·知识蒸馏·模型蒸馏·上下文蒸馏·在策略蒸馏·微软研究院·大模型蒸馏
在策略上下文蒸馏:OPCD 把上下文知识直接焊进参数里 | 微软研究院论文链接:https://arxiv.org/abs/2602.12275 发布时间:2026.02.12 机构:微软研究院
我是有底线的