MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页https://tangyuan96.github.io/minigpt_3d_project_page/
代码https://github.com/TangYuan96/MiniGPT-3D
论文https://arxiv.org/pdf/2405.01413

MiniGPT-3D在多个任务上取得了SoTA ,被ACM MM2024 接收,只拥有47.8M 的可训练参数,在一张RTX 3090训练约一天时间得到。

MiniGPT-3D的性能大幅超过了用8张A100或8张A800训练的3D-LLM工作。

值得注意的是,MiniGPT-3D相较这些需要8卡的3D-LLMs在训练时间和训练参数上分别降低了的6倍和260倍

MiniGPT-3D如此低的训练成本为端侧设备持续学习提供了更多可能!!!

概况

对话demo

定量比较

更多对话例子

相关推荐
码农小白AI1 分钟前
IACheck+AI报告审核赋能烟草尼古丁检测:当安全数据进入“高一致性审核时代”
人工智能·安全
TG_yunshuguoji2 分钟前
阿里云代理商:企业级AI应用 阿里云GPU服务器运行DeepSeek V4优化方案
人工智能·阿里云·云计算·ai智能体·deepseek-v4
月诸清酒2 分钟前
59-260512 AI 科技日报(Gemini 视频模型曝光、DeepSeek V4 限时免费、OpenAI 布局企业部署)
人工智能
javajenius4 分钟前
Chroma:AI应用的开源向量数据基础设施
人工智能·其他·开源
m0_372257024 分钟前
BM25 + Embedding 混合检索 实现
人工智能·深度学习·机器学习·embedding
Deepoch4 分钟前
Deepoc 具身模型赋能无人机群组野外自主作业研究
人工智能·无人机·具身模型·deepoc
techdashen4 分钟前
Cloudflare Workflows V2:当 AI Agent 成为基础设施,调度系统如何重新设计
人工智能
番茄炒西红柿炒洋柿子7 分钟前
OpenCV使用平面拼接图片
人工智能·opencv·平面
guohuang7 分钟前
写 Prompt 的三要素:目标、约束、验收(附实战模板)
人工智能
sunneo8 分钟前
02-GAP模型重构-AI产品闭环设计实战
人工智能·产品运营·aigc·产品经理·ai-native