苹果开源SHARP模型:一秒内将2D照片转为3D场景

2025-12-18 18:56:38   |   探索者   |   1108

12月18日,据报道,苹果公司开源了一项名为SHARP的新型人工智能模型。该技术能够在一秒内将单张普通2D照片转换为具有真实物理比例的三维场景,其合成速度相比传统方案提升了三个数量级,有望为移动端3D内容创作与空间计算应用带来突破。

传统3D重建通常需要从多个角度拍摄数十甚至上百张照片,并通过复杂计算才能完成建模。而SHARP基于先进的3D高斯泼溅技术,通过使用海量合成与真实世界数据进行训练,使模型能够从单张照片中直接预测数百万个3D高斯球的位置与外观,从而实现近乎实时的场景重建。

在成像质量方面,SHARP在多项基准测试中表现优异。据苹果论文数据,该模型将LPIPS(感知图像块相似度)指标降低了25%至34%,DISTS(纹理相似度)指标降低了21%至43%,这意味着其生成的3D视图在细节纹理与整体结构上更接近真实世界,并支持基于真实尺度的相机移动模拟。

不过,SHARP目前仍存在一定的视角限制。为了兼顾生成速度与真实性,模型主要重建拍摄视角附近的3D内容,不会对完全被遮挡或未拍摄到的区域进行过度推断。因此用户浏览生成场景时,视角移动范围需保持在原始拍摄位置附近。

苹果已将SHARP的完整代码及相关资源发布于GitHub平台,供全球开发者下载测试。这一开源举措预计将加速3D重建技术在移动设备、增强现实、虚拟现实等领域的应用落地,为内容创作者与研究者提供更高效的3D内容生成工具。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

苹果开源SHARP模型:一秒内将2D照片转为3D场景

2025-12-18 18:56:38 浏览量: 1108 作者: 探索者

12月18日,据报道,苹果公司开源了一项名为SHARP的新型人工智能模型。该技术能够在一秒内将单张普通2D照片转换为具有真实物理比例的三维场景,其合成速度相比传统方案提升了三个数量级,有望为移动端3D内容创作与空间计算应用带来突破。

传统3D重建通常需要从多个角度拍摄数十甚至上百张照片,并通过复杂计算才能完成建模。而SHARP基于先进的3D高斯泼溅技术,通过使用海量合成与真实世界数据进行训练,使模型能够从单张照片中直接预测数百万个3D高斯球的位置与外观,从而实现近乎实时的场景重建。

在成像质量方面,SHARP在多项基准测试中表现优异。据苹果论文数据,该模型将LPIPS(感知图像块相似度)指标降低了25%至34%,DISTS(纹理相似度)指标降低了21%至43%,这意味着其生成的3D视图在细节纹理与整体结构上更接近真实世界,并支持基于真实尺度的相机移动模拟。

不过,SHARP目前仍存在一定的视角限制。为了兼顾生成速度与真实性,模型主要重建拍摄视角附近的3D内容,不会对完全被遮挡或未拍摄到的区域进行过度推断。因此用户浏览生成场景时,视角移动范围需保持在原始拍摄位置附近。

苹果已将SHARP的完整代码及相关资源发布于GitHub平台,供全球开发者下载测试。这一开源举措预计将加速3D重建技术在移动设备、增强现实、虚拟现实等领域的应用落地,为内容创作者与研究者提供更高效的3D内容生成工具。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号