MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页https://tangyuan96.github.io/minigpt_3d_project_page/
代码https://github.com/TangYuan96/MiniGPT-3D
论文https://arxiv.org/pdf/2405.01413

MiniGPT-3D在多个任务上取得了SoTA ,被ACM MM2024 接收,只拥有47.8M 的可训练参数,在一张RTX 3090训练约一天时间得到。

MiniGPT-3D的性能大幅超过了用8张A100或8张A800训练的3D-LLM工作。

值得注意的是,MiniGPT-3D相较这些需要8卡的3D-LLMs在训练时间和训练参数上分别降低了的6倍和260倍

MiniGPT-3D如此低的训练成本为端侧设备持续学习提供了更多可能!!!

概况

对话demo

定量比较

更多对话例子

相关推荐
UMI赋能企业26 分钟前
企业视频库管理高效策略
大数据·人工智能
一念&2 小时前
今日科技热点 | AI加速变革,量子计算商用化,5G应用新机遇
人工智能·科技·量子计算
严文文-Chris2 小时前
【GPT-5 与 GPT-4 的主要区别?】
人工智能·gpt
过往入尘土3 小时前
计算机视觉:从 “看见” 到 “理解”,解锁机器感知世界的密码
人工智能
飞哥数智坊4 小时前
别再组团队了,AI时代一个人就能创业
人工智能·创业
严文文-Chris4 小时前
GPT5的Test-time compute(测试时计算)是什么?
人工智能
Java中文社群4 小时前
白嫖ClaudeCode秘籍大公开!超详细
人工智能·后端
MicrosoftReactor5 小时前
技术速递|使用 AI 应用模板扩展创建一个 .NET AI 应用与自定义数据进行对话
人工智能·.net
迪菲赫尔曼6 小时前
大模型入门实战 | 基于 YOLO 数据集微调 Qwen2.5-VL-3B-Instruct 的目标检测任务
人工智能·yolo·目标检测·大模型·微调·新手入门·qwen2.5