Imagination|第一次!手机GPU实现了桌面级光追效果( 二 )


Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片

Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片

如何实现移动端光追性能和功耗的平衡?
实际上,想要在已有的移动设备上实现光线追踪功能并非不可能 。
“采用软件方案也能在移动端实现光线追踪效果,但那只能在演示当中,如果应用于游戏,效果一定不太好 。” Imagination技术前瞻副总裁Kristof Beets 指出,“因为这种方案没办法在功耗和效果之间达到一个很好的平衡,软件仍然要使用大量的计算资源用于阴影和多边形的贴图 。”
为了更直观反映实现光线追踪不同方案及效果的差别,Imagination对光线追踪进行了分级,建立了光线追踪等级系统(RTLS):
1级为现有硬件上的软件解决方案 。性能低,效率低 。
2级增加了用于光线追踪的第一部分硬件 。与1级相比,可以将基本光线追踪效果的效率提高44倍 。
3级增加了用以处理发射光线的硬件,与2级解决方案相比,可大大降低功耗 。
4级增加了相干性聚集功能,针对复杂的桌面级效果大大提升了性能,让其可以在移动端功耗预算下应用 。
5级是一项未来等级,可在场景中实现更大数目的动态目标,并带有额外的硬件加速 。
Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片

Imagination新发布的CXT GPU IP是一个RTLS 4级的光追产品,目前业界的其它移动端解决方案为RTLS 1级 。Imagination能够实现RTLS 4级光追的核心是IMG CXT-48-1536 RT3 内核具有三个光线加速集群(RAC),可提供总体高达1.3 GRay/s的性能,即使在移动设备低功耗的情况下,也能以1080P分辨率实现30~60FPS的实时光线追踪渲染,满足日常游戏高端需求 。
Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片

RAC包含了光线存储(Ray Store)、光线任务调度器(Ray Task Scheduler)和相干性聚集器(Coherency Gatherer),并与两个128宽的统一着色器集群(USC)紧密耦合,着色器集群有高速专用数据通路,可以实现高效且功耗最低的光线追踪部署 。
时昕解释,“很多光追算法用传统的方法实现效率很低,用过专门的硬件单元,比如RAC,效率成倍提升 。”
Imagination给出的数据显示,在光栅化图形处理性能方面,最新的CXT与Imagination的上一代GPU IP相比,计算、纹理和几何性能都提高了50% 。
Imagination|第一次!手机GPU实现了桌面级光追效果
文章图片

功耗方面,得益于低功耗超标量(superscalar)架构可在低时钟频率下提供高性能,从而实现更高的帧率功耗比(FPS/W)效率,Imagination图像压缩(IMGIC)技术也可以大幅降低带宽需求 。
高性能和低功耗看似对立,但实际并不矛盾 。
“以前在复杂场景的光照效果,包括反射、阴影、全局照明等,都要靠着色器一个个去模拟计算,我们的CXT把渲染的负载转移到更为专用的硬件上面,效率更高的同时实现更低功耗 。” Kristof Beets解释 。
当然,讨论光线追踪的性能和功耗不能抛开技术路线 。光线追踪有两种方式来实现,一种是用光线查询的方式,一种是用光线管线的方式,这两种方式都需要计算10亿条及更多数量的光线 。
光线管线的方式是计算光源发射出的光子,碰到场景当中物体的反射、折射等反应,最终达摄像机位或者游戏玩家的眼睛 。光线查询方式就是反过来,从摄像机位或游戏玩家的角度,计算出光源 。