Intel|Intel重回高性能GPU市场!Xe HPG微架构潜力无穷

2022年Intel接连发力,在6月份率先推出了旗下首款高性能桌面级GPU A380,虽然定位入门级,却也初具规模 。
而在同年10月再次推出了中高性能的A750/A770桌面级GPU,本次的两款显卡一跃达到了市场主流产品的水准,虽然尚未达到旗舰级发烧性能,但其潜力可见一斑 。
下面则为大家简单解析一下Intel的Xe HPG微架构,到底有何玄妙之处 。
Xe HPG微架构浅析
本代Intel 3款显卡采用了Xe HPG微架构设计,最初发布的入门级A380显卡包含8个Xe内核(Xe Core),即两个渲染切片(Rendering Slice),下面我们从最小的Xe Core逐步为大家讲解 。
Intel|Intel重回高性能GPU市场!Xe HPG微架构潜力无穷
文章图片

Xe Core
每个Xe Core包含16个256位宽的(XVE)矢量引擎,它主要负责传统图像处理计算的任务,且提供大部分运算 。
同时由于AI算法核心几乎完全围绕着一系列大型矩阵算法和累加算法,所以每个Xe Core还包含16个1024位宽的矩阵引擎(XMX),主要为加速AI运算而生 。
为了满足矩阵、矢量和光线追踪单元的高带宽需求,每个Xe Core中还构建了一个192KB的大型本地内存 。它可以根据每个工作负载的需要在L1缓存和共享本地内存(SLM) 之间动态分配 。
Intel|Intel重回高性能GPU市场!Xe HPG微架构潜力无穷
文章图片

Render slice
综上所述,每4个微小的Xe Core,将构成一个Render slice(渲染切片) 。除此之外,每个Render slice还集成了几何处理、光栅化、纹理采样、像素处理和光线跟踪等主流图形技术 。
新的光线追踪单元架构可为DirectX Raytracing和Vulkan RT提供全面支持,通过加速光线遍历、光线盒交叉点和光线基元交叉点实现逼真的闪电和视觉保真度 。
Intel|Intel重回高性能GPU市场!Xe HPG微架构潜力无穷
文章图片

Xe HPG
Xe HPG架构最大的特点就是出色的灵活性,Intel可通过叠加渲染切片的方法来构建不同核心,目前最少为2个(8 Xe Core),最大可以做到8个(32 Xe Core),A380为两个,而A770则为8个Render slice 。
通过此方法,可实现GPU配置从低功耗解决方案扩展到旗舰级的游戏引擎 。每个Render slice通过大型L2缓存的高带宽内存交换矩阵,能够灵活地扩展到强大的多切片配置,并连接到独立的GPU基础架构 。
具有连接每个切片的大型二级缓存的高带宽内存交换矩阵能够灵活地扩展到强大的多切片配置,并连接到独立的GPU基础架构 。
Intel Xe HPG微架构 其他特性
XeSS 超级采样
针对游戏帧数优化方面,目前NVIDIA拥有DLSS、NIS技术,AMD拥有FSR、RSR技术,这几种技术旨在降低渲染分辨率,输出高帧率画面,但原理有所不同 。
而Intel的XeSS超级采样技术,同样在未发布时就引起了玩家的高度关注 。
Intel|Intel重回高性能GPU市场!Xe HPG微架构潜力无穷
文章图片

它是由机器学习通过相邻像素以及运动补偿先前帧重建子像素细节,可以帮助合成非常接近于原生超高分辨率渲染质量的图像 。
整体算法采用了人工智能算法和硬件加速,以较低分辨率渲染所要求的性能水平,提高输出分辨率,提供超高清视觉效果,性能可提高2倍 。
根据官方的描述,XeSS采用了与DLSS相似的时间算法,它类似于用相机拍摄长曝光,捕捉的时间越长,收集到的细节也就越多 。
Intel|Intel重回高性能GPU市场!Xe HPG微架构潜力无穷