苹果发布开源 AI 模型 SHARP

苹果公司于近期发布并开源了名为 SHARP (Sharp Monocular View Synthesis) 的新型AI模型,它能在1秒内将单张2D照片转换为具有真实物理尺度的高保真3D场景

核心突破与技术特点

为了方便你快速了解,下表汇总了SHARP模型的关键特点、技术实现与局限性:

特性维度 具体说明
核心功能 仅凭一张2D照片,在1秒内完成高质量3D场景重建。
技术原理 基于3D高斯泼溅技术,通过神经网络单次前馈,直接预测数百万个3D高斯球。
质量表现 在LPIPS(感知相似度)和DISTS(纹理相似度)指标上,均显著优于此前最佳模型。
主要局限性 目前主要生成原拍摄视角附近的3D视图,无法可靠"脑补"照片中完全被遮挡或未拍摄到的区域。

开源情况与获取方式

苹果已将SHARP模型的完整代码、预训练模型及相关资源 在多个开发者平台开源-5,包括:

  • GitHub仓库apple/ml-sharp

  • Hugging Faceapple/Sharp

  • 苹果官方项目页面

此举意味着全球开发者可以免费下载、使用甚至在其基础上进行二次开发。

应用前景与影响

SHARP模型的发布,主要有以下几点意义:

  1. 大幅降低3D内容创作门槛:将原本需要专业设备和长时间计算的过程,简化为"一张照片、一秒生成",可能重塑游戏、建筑设计、AR/VR等领域的创作流程。

  2. 推动空间计算生态发展:这与苹果重点发展的Vision Pro等空间计算设备战略高度协同,可为AR/VR应用快速生成丰富的3D素材。

  3. 赋能苹果自身产品 :该技术未来很可能被集成到苹果的Apple Intelligence图像生成工具(Image Playground) 乃至实时翻译等产品功能中,提升其核心体验。

相关推荐
小鸡吃米…4 分钟前
机器学习 - 轮次(Epoch)
人工智能·深度学习·机器学习
风栖柳白杨14 分钟前
【语音识别】Qwen3-ASR原理及部署
人工智能·python·语音识别·xcode·audiolm
Wang2012201320 分钟前
2026流行的 AI Agent开发框架 (构建“智能体”)
人工智能
张人玉20 分钟前
VisionPro Blob、条码识别、OCR 结构化速记版
人工智能·算法·机器学习·vsionpro
Elastic 中国社区官方博客27 分钟前
Elasticsearch:使用 Elastic Workflows 构建自动化
大数据·数据库·人工智能·elasticsearch·搜索引擎·自动化·全文检索
跨境卫士-小汪32 分钟前
选品更稳的新打法:用“用户决策阻力”挑品——阻力越大,越有机会做出溢价
大数据·人工智能·产品运营·跨境电商·内容营销·跨境
空中楼阁,梦幻泡影1 小时前
主流4 大模型(GPT、LLaMA、DeepSeek、QWE)的训练与推理算力估算实例详细数据
人工智能·gpt·llama
Dev7z1 小时前
基于改进YOLOv5n与OpenVINO加速的课堂手机检测系统设计与实现
人工智能·yolo·openvino·手机检测·课堂手机检测
Elastic 中国社区官方博客1 小时前
Elastic 9.3:与数据对话、构建自定义 AI agents、实现全自动化
大数据·人工智能·elasticsearch·搜索引擎·ai·自动化·全文检索
启友玩AI1 小时前
方言守护者:基于启英泰伦CI-F162GS02J芯片的“能听懂乡音”的智能夜灯DIY全攻略
c语言·人工智能·嵌入式硬件·ai·语音识别·pcb工艺