MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页https://tangyuan96.github.io/minigpt_3d_project_page/
代码https://github.com/TangYuan96/MiniGPT-3D
论文https://arxiv.org/pdf/2405.01413

MiniGPT-3D在多个任务上取得了SoTA ,被ACM MM2024 接收,只拥有47.8M 的可训练参数,在一张RTX 3090训练约一天时间得到。

MiniGPT-3D的性能大幅超过了用8张A100或8张A800训练的3D-LLM工作。

值得注意的是,MiniGPT-3D相较这些需要8卡的3D-LLMs在训练时间和训练参数上分别降低了的6倍和260倍

MiniGPT-3D如此低的训练成本为端侧设备持续学习提供了更多可能!!!

概况

对话demo

定量比较

更多对话例子

相关推荐
春日见1 小时前
自驾算法的日常工作?如何提升模型性能?
linux·人工智能·机器学习·计算机视觉·自动驾驶
freewlt1 小时前
深入理解 OpenClaw:打造安全可控的本地 AI 助理架构
人工智能·安全·架构·openclaw
*JOKER2 小时前
Flow Matching&生成算法
人工智能·深度学习·机器学习·大模型·生成模型·flow matching
databook2 小时前
别让AI代码,变成明天的技术债
人工智能·程序员·ai编程
人工智能AI技术2 小时前
计算机专业面试必看!90%学生都踩过的算法面雷区
人工智能·面试
千寻girling2 小时前
面试官 : “ 说一下 Python 中的常用的 字符串和数组 的 方法有哪些 ? ”
人工智能·后端·python
m0_706653232 小时前
深入理解Gumbel-Softmax技巧及其应用
人工智能
七夜zippoe2 小时前
OpenClaw 接入 WhatsApp:消息推送实战
大数据·人工智能·microsoft·whatsapp·openclaw
眠りたいです2 小时前
使用LangChain进行AI应用构建-RAG及相关核心组件认识(二)
人工智能·langchain·rag