【论文阅读】Point2RBox (CVPR’2024)

相关推荐
m0_6501082419 小时前
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架
论文阅读·自动驾驶·轨迹生成与规划·世界动作模型·e2e-ad·vlm导向评估器·minddrive
CoookeCola20 小时前
无需抠图!Qwen-Image-Layered 一键分解图像图层,支持图层级精准编辑
论文阅读·深度学习·计算机视觉·ai作画·开源·视觉检测·aigc
bylander20 小时前
【论文阅读】VTP:Towards Scalable Pre-training of Visual Tokenizers for Generation
论文阅读·图像处理·大模型
czijin20 小时前
【论文阅读】LoRA: Low-Rank Adaptation of Large Language Models
论文阅读·人工智能·语言模型
有Li21 小时前
诊断文本引导的分层分类全玻片图像表征学习|文献速递-医疗影像分割与目标检测最新技术
论文阅读·深度学习·文献·医学生
万里鹏程转瞬至2 天前
论文简读:Qwen2.5-VL Technical Report
论文阅读·深度学习·多模态
万里鹏程转瞬至2 天前
论文简读:Qwen3-VL Technical Report | Qwen3VL技术报告
论文阅读·深度学习·多模态
墨绿色的摆渡人2 天前
论文笔记(一百一十二)Pos3R: 6D Pose Estimation for Unseen Objects Made Easy
论文阅读
c0d1ng2 天前
十二月第三周周报(论文阅读)
论文阅读
Xy-unu2 天前
[LLM]AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning
论文阅读·人工智能·算法·机器学习·transformer·论文笔记·剪枝