MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页https://tangyuan96.github.io/minigpt_3d_project_page/
代码https://github.com/TangYuan96/MiniGPT-3D
论文https://arxiv.org/pdf/2405.01413

MiniGPT-3D在多个任务上取得了SoTA ,被ACM MM2024 接收,只拥有47.8M 的可训练参数,在一张RTX 3090训练约一天时间得到。

MiniGPT-3D的性能大幅超过了用8张A100或8张A800训练的3D-LLM工作。

值得注意的是,MiniGPT-3D相较这些需要8卡的3D-LLMs在训练时间和训练参数上分别降低了的6倍和260倍

MiniGPT-3D如此低的训练成本为端侧设备持续学习提供了更多可能!!!

概况

对话demo

定量比较

更多对话例子

相关推荐
万少4 小时前
小龙虾(openclaw),轻松玩转自动发帖
前端·人工智能·后端
飞哥数智坊6 小时前
openclaw 重大更新,真的懂我啊
人工智能
KaneLogger6 小时前
AI 时代编程范式迁移的思考
人工智能·程序员·代码规范
飞哥数智坊6 小时前
养虾记第2期:从“人工智障”到“赛博分身”,你的龙虾还缺这两个灵魂
人工智能
飞哥数智坊6 小时前
龙虾虽香,小心扎手!官方点名后,我们该怎么“养虾”?
人工智能
yiyu07166 小时前
3分钟搞懂深度学习AI:实操篇:卷积层
人工智能·深度学习
字节架构前端7 小时前
Skill再回首—深度解读Anthropic官方最新Skill白皮书
人工智能·agent·ai编程
冬奇Lab9 小时前
OpenClaw 深度解析(八):Skill 系统——让 LLM 按需学习工作流
人工智能·开源·源码阅读
冬奇Lab9 小时前
一天一个开源项目(第45篇):OpenAI Agents SDK Python - 轻量级多 Agent 工作流框架,支持 100+ LLM 与实时语音
人工智能·开源·openai