NVIDIA推出LATTE3D文本转3D生成AI模型被称为虚拟3D打印机
NVIDIA的AI研究团队推出了一种新的生成模型,可以在一秒钟内将文本提示转化为3D模型,为游戏开发、设计和机器人等应用做好准备(或至少接近准备)。到目前为止,该模型仅被训练来生成“动物和日常物品”,但可以添加更多类别。近乎即时的速度应该会改变许多工作流程。
虽然图像和视频生成AI模型已经在新闻中占据主导地位一段时间了,但NVIDIA已经通过LATTE3D朝着下一个逻辑方向迈出了一步,这是一种新的生成式AI模型,可以在不到一秒的时间内将文本提示转换为完整的3D模型。该技术在上周的NVIDIAGTC活动中宣布,被吹捧为类似于“虚拟3D打印机”,因为它可以“以用于标准渲染应用程序的流行格式”立即提供3D模型,并准备好部署在视频游戏开发、广告、设计项目或任何需要虚拟环境的应用程序,包括VR和AR。
文本转3D生成式AI并不是一项新技术,NVIDIA的研究论文本身将LATTE3D与MVDream、3DTopia和LGM等几个现有系统进行了比较。LATTE3D的压倒性优势在于速度。在对比测试中,其他AI模型需要20秒到30分钟以上才能生成输出,而LATTE3D只需400毫秒即可生成类似的(通常质量更高)渲染。
值得注意的是,与3D打印一样,LATTE3D和其他AI模型的输出质量会随着时间的增加而提高。好处是,与3D打印不同,人们可以选择首先优先考虑速度而不是质量,然后决定等待更精细的输出,而不是从一开始就固定设置。
与任何其他生成式人工智能一样,LATTE3D具有改变许多工作流程的潜力。以前,人们必须搜索3D资源库或投入宝贵的工时来创建一个简单的对象,而借助NVIDIA的技术,只需输入简短的描述并将生成的输出导入到软件应用程序或平台中即可。
到目前为止,研究团队仅训练了LATTE3D来创建日常物体和动物的模型,但这可以通过正确的数据集扩展到其他类别。该模型使用NVIDIAA100TensorCoreGPU进行训练,并在该公司的演示中在单个NVIDIARTXA6000上运行。
作为一个研究项目,LATTE3D仍在开发中,到目前为止还没有将其作为产品或服务发布的讨论。该项目的未来计划包括扩展“文本到4D”的功能,或生成3D动画。
使用MetaQuest3耳机和XREALAir2ProAR眼镜探索沉浸式虚拟和混合现实环境,这两款耳机均可在亚马逊上购买。
标签: