Meta提出用毕加索等艺术家美术风格渲染3D世界

(映维网Nweon2022年08月15日)从游戏到电影 , 再到虚拟现实和混合现实 , 市场对新的视觉3D内容需求正不断增长 。 在名为《SNeRF:StylizedNeuralImplicitRepresentationsfor3DScenes》的论文中 , Meta提出了一种有趣的方案:用毕加索或莫内等艺术家的美术风格视图来渲染3D世界 , 并允许穿戴VR头显的我们在其中漫步探索 。
Meta提出用毕加索等艺术家美术风格渲染3D世界
文章图片
直接将基于图像的样式化技术应用于3D场景会导致不同视图之间出现闪烁伪影 , 因为每个视图都是独立样式化 , 没考虑底层3D结构 。 尽管社区已经探索了各种3D表示方法来解决这个问题 , 但大多不能很好地捕捉目标样式 , 因为它们只对场景的外观进行样式化 , 而几何同样是样式的重要组成部分 。 延伸阅读:〔映维会讲〕高岱恒:Nerf神经辐射场渲染技术
最近 , 神经辐射场(NeRF)提供了一种可以产生高质量新视图合成结果的紧凑3D场景表示 。 紧凑性、表现力和灵活性令NeRF成为一种极具吸引力的选择 。 然而 , 采用NeRF进行神经风格转换会带来巨大的内存约束 。 要从NeRF渲染像素 , 必须沿camera光线进行密集采样 。 这需要大量内存用于渲染和执行反向传播 。
Meta提出用毕加索等艺术家美术风格渲染3D世界】针对这个问题 , Meta提出结合神经负反馈和基于图像的神经风格转换来执行三维场景样式化 。 神经风格转换实现了一种灵活的样式化方法 , 不需要专业美术的示例输入 。 另外 , 研究人员通过将3D场景样式转换过程分为两个交替运行的步骤来解决NeRF的内存限制 。 这允许他们能够充分利用硬件的内存容量 , 在高分辨率图像渲染NeRF或执行神经风格的传输 。
在在《SNeRF:StylizedNeuralImplicitRepresentationsfor3DScenes》这项研究中 , 他们重点研究了样式化三维场景以匹配参考样式图像的问题 , 并提出了一种三维场景神经样式化框架SNeRF 。 据介绍 , 它可以生成样式化三维场景的新视图 , 同时保持交叉视图的一致性 。
具体来说 , 给定一个三维场景 , 团队的目标是对其进行操作 , 并令所述场景的渲染图像与参考图像的样式相匹配 。 另外 , 来自不同视图的同一场景渲染图像应保持一致 。 所以 , 由于紧凑性和灵活性优势 , 研究人员使用NeRF作为场景表示的选择 。 他们提出了一种内存高效的训练方法 , 可以在样式化和NeRF训练之间交替进行 , 从而获得高分辨率的结果 。
Meta使用以下函数对表示为NeRF的3D场景进行样式化 , 从而匹配参考样式图像:
Meta提出用毕加索等艺术家美术风格渲染3D世界
文章图片
之前社区的研究是同时优化了两种损失 , 以进行场景样式化 。 这需要从NeRF渲染完整图像 , 从而在每个训练步骤计算????tran????fer 。 这非常耗时 。 另外 , 这种方法需要在三个内存密集型组件之间共享内存 , 大大限制了样式化结果的分辨率以及样式化方法的选择 。
为了解决上述方法的内存负担 , 团队提出了一种受坐标下降启发的交替训练机制 。 他们的见解是 , 可以解耦????tran????fer和????nerf,一次最小化一个 。 计算????tran????fer , 只需要特征提取器、目标样式图像和场景的渲染图像 。 同时 , 要计算????nerf , 只需要体三维渲染器和目标图像 。
Meta提出用毕加索等艺术家美术风格渲染3D世界
文章图片
所提出的交替训练机制允许将全部硬件容量用于图像样式化或NeRF训练 。 对于图像样式化 , 这使他们能够对整个图像执行样式化 , 并实现更全局一致的样式化结果 。 对于NeRF训练 , 可以训练NeRF以生成更高分辨率的结果 , 并将所属方法应用于动态场景 。 使用相同的硬件 , 所述训练机制现在可以将NeRF样式化 , 并合成1008×756大小的图像 。 这比以前同时进行训练和样式化时所能合成的图像大4倍 。