相关推荐
m0_6501082419 小时前
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架CoookeCola20 小时前
无需抠图!Qwen-Image-Layered 一键分解图像图层,支持图层级精准编辑bylander20 小时前
【论文阅读】VTP:Towards Scalable Pre-training of Visual Tokenizers for Generationczijin20 小时前
【论文阅读】LoRA: Low-Rank Adaptation of Large Language Models有Li21 小时前
诊断文本引导的分层分类全玻片图像表征学习|文献速递-医疗影像分割与目标检测最新技术万里鹏程转瞬至2 天前
论文简读:Qwen2.5-VL Technical Report万里鹏程转瞬至2 天前
论文简读:Qwen3-VL Technical Report | Qwen3VL技术报告墨绿色的摆渡人2 天前
论文笔记(一百一十二)Pos3R: 6D Pose Estimation for Unseen Objects Made Easyc0d1ng2 天前
十二月第三周周报(论文阅读)Xy-unu2 天前
[LLM]AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning





