MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页https://tangyuan96.github.io/minigpt_3d_project_page/
代码https://github.com/TangYuan96/MiniGPT-3D
论文https://arxiv.org/pdf/2405.01413

MiniGPT-3D在多个任务上取得了SoTA ,被ACM MM2024 接收,只拥有47.8M 的可训练参数,在一张RTX 3090训练约一天时间得到。

MiniGPT-3D的性能大幅超过了用8张A100或8张A800训练的3D-LLM工作。

值得注意的是,MiniGPT-3D相较这些需要8卡的3D-LLMs在训练时间和训练参数上分别降低了的6倍和260倍

MiniGPT-3D如此低的训练成本为端侧设备持续学习提供了更多可能!!!

概况

对话demo

定量比较

更多对话例子

相关推荐
摘星编程3 分钟前
AI Core硬件架构剖析:Cube、Vector、Scalar三核协同机制
人工智能·硬件架构·cann
2301_792185885 分钟前
基于软件工程的结构化分析实验
人工智能·数据挖掘·软件工程
love530love12 分钟前
【笔记】Intel oneAPI 开发环境配置
人工智能·windows·笔记·oneapi·onednn·deep neural
数字冰雹13 分钟前
从“东数西算”到智慧机房:数字孪生如何重塑数据中心的“智能大脑”?
大数据·人工智能·数据可视化
自己的九又四分之三站台18 分钟前
OpenCV介绍
人工智能·opencv·计算机视觉
容智信息21 分钟前
荣膺ISC.AI 2025创新百强!容智信息HyperAgent超级智能体,引领企业级智能体落地新范式
人工智能·自然语言处理·金融·自动驾驶
Olafur_zbj24 分钟前
【IC】timeloop:AI Core量化仿真
人工智能
geneculture36 分钟前
数学实在性问题的融智学解决方案
人工智能·信息科学·融智学的重要应用·融智时代(杂志)·融智时代·数学哲学·抽象实体
16Miku42 分钟前
Qwen3-8B vLLM 部署实践教程(AutoDL 平台)
人工智能·ai·autodl·vllm·部署大模型·qwen3-8b
RaymondZhao341 小时前
【深度硬核】AI Infra 架构漫游指南
人工智能·深度学习·架构