腾讯混元3D团队开源 P3-SAM: 原生3D零件分割

将3D资产分割为其组成部分对于增强三维理解、促进模型复用以及支持部件生成等应用至关重要。然而,现有方法在处理复杂物体时存在鲁棒性不足等问题,且无法实现全自动化流程。本文提出了一种原生3D点提示部件分割模型P3-SAM,旨在实现任意三维物体的全自动组件分割。受SAM启发,P3-SAM由特征提取器、多重分割头和IoU预测器组成,支持用户交互式分割。我们还提出了一种算法来自动筛选并合并模型预测的掩膜,实现部件实例分割。该模型在我们新建的包含370万个带合理分割标签模型的数据集上进行训练。对比实验表明,本方法能在任意复杂物体上实现精确分割结果和强大鲁棒性,达到了当前最优性能。

方法


P3-SAM的网络架构:输入点云被送入特征提取器以获取逐点特征。这些特征、点提示以及原始点云随后被输入到一个两阶段多掩模分割器中,生成不同尺度的三个掩模。最后,利用IoU预测器评估掩模质量,并选择最佳掩模作为最终预测结果。


自动分割流程:通过FPS采样点提示,输入P3-SAM模型获取多个掩码,随后采用非极大值抑制(NMS)合并冗余掩码。最后将点级掩码投影到网格面上,得到部件分割结果。

https://murcherful.github.io/P3-SAM/

相关推荐
冬奇Lab7 小时前
Agent 系列(一):Agent 是什么——不只是「会调工具的 LLM」
人工智能·llm·agent
冬奇Lab8 小时前
RAG 系列(二十四):代码 RAG——让 AI 理解你的代码库
人工智能·llm
南屹川8 小时前
【算法】动态规划实战:从入门到精通
人工智能
人工智能培训8 小时前
大模型与传统小模型、传统NLP模型的核心差异解析
人工智能·深度学习·神经网络·机器学习·生成对抗网络
沪漂阿龙8 小时前
面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战
人工智能·架构
二等饼干~za8986688 小时前
从零搭建 Geo 开源项目源码开发环境——以 GeoServer 为例
开源
薛定猫AI8 小时前
【深度解析】Gemini Omni 多模态生成与 Agent 化创作工作流:从视频编辑到 UI 生成的技术演进
人工智能·ui·音视频
羊羊小栈8 小时前
AI赋能电力巡检:智能故障预警系统
人工智能·yolo·目标检测·毕业设计·大作业
Python私教8 小时前
视觉 Agent 爬取 vs Playwright 脚本:Browser Use 2026 选型表
人工智能
Python私教8 小时前
Crawlee StagehandCrawler:自然语言点 Load More 的工程化爬虫
人工智能