单图0.5秒生成,Stability AI与VAST开源3D模型“TripoSR”
近日,专注于视觉内容生成的模型公司 Stability AI 宣布与华人团队VAST开源了可单图生成 3D的AI模型“TripoSR”。
在Nvidia A100上进行测试时,TripoSR可以在大约0.5秒内生成草稿质量的3D输出(纹理网格),优于OpenLRM等其他开放图像到3D模型。除此之外,TripoSR在无需GPU的情况下也可以运行。
据悉,TripoSR的灵感来自Adobe 2023年11月提出的LRM:单图像到3D的大型重建模型。这种新的图像到3D模型方法旨在满足娱乐、游戏、工业设计和建筑专业人士日益增长的需求,并提供用于可视化详细3D对象的响应式输出。
Stability AI 称,“我们对基本LRM模型进行了多项技术改进,包括通道号优化、蒙版监督和更高效的裁剪渲染策略。同时,我们还通过一个更高质量的Objaverse数据集子集训练数据,从而让TripoSR可以更接近地复制现实世界中的图像分布,显著提高模型的泛化能力。”
上一篇:visionOS 1.1最快本周发布,虚拟键盘和EyeSight功能将带来改进[ 03-06 ]
下一篇:没有了!