苹果发布开源 AI 模型 SHARP

自不量力的A同学2025-12-22 9:17

苹果公司于近期发布并开源了名为 SHARP (Sharp Monocular View Synthesis) 的新型AI模型，它能在1秒内将单张2D照片转换为具有真实物理尺度的高保真3D场景。

为了方便你快速了解，下表汇总了SHARP模型的关键特点、技术实现与局限性：

特性维度	具体说明
核心功能	仅凭一张2D照片，在1秒内完成高质量3D场景重建。
技术原理	基于3D高斯泼溅技术，通过神经网络单次前馈，直接预测数百万个3D高斯球。
质量表现	在LPIPS（感知相似度）和DISTS（纹理相似度）指标上，均显著优于此前最佳模型。
主要局限性	目前主要生成原拍摄视角附近的3D视图，无法可靠"脑补"照片中完全被遮挡或未拍摄到的区域。

苹果已将SHARP模型的完整代码、预训练模型及相关资源 在多个开发者平台开源-5，包括：

此举意味着全球开发者可以免费下载、使用甚至在其基础上进行二次开发。

SHARP模型的发布，主要有以下几点意义：

大幅降低3D内容创作门槛：将原本需要专业设备和长时间计算的过程，简化为"一张照片、一秒生成"，可能重塑游戏、建筑设计、AR/VR等领域的创作流程。
推动空间计算生态发展：这与苹果重点发展的Vision Pro等空间计算设备战略高度协同，可为AR/VR应用快速生成丰富的3D素材。
赋能苹果自身产品 ：该技术未来很可能被集成到苹果的Apple Intelligence 、图像生成工具（Image Playground） 乃至实时翻译等产品功能中，提升其核心体验。