NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心

2022年3月的GTC技术大会上,NVIDIA正式发布了首款数据中心CPU——Grace,同时打造了两颗超级芯片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一 。
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

Grace CPU二合一
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

Grace CPU+Hopper GPU二合一
现在,NVIDIA官方详细揭示了Grace Superchip超级芯片的设计与性能、能效 。
它通过NVLink-C2C芯片间互连总线,将两颗Grace CPU整合在一块基板上,彼此之间的双向带宽多达900GB/s 。
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

Grace CPU基于Armv9-A 9.0架构、Neoverse V2 64位内核,以4个128-bit功能单元的方式配置了两组SIMD矢量指令集,一是SVE 2(缩放矢量扩展第二版),二是NEON(高级SIMD) 。
它还支持LSE(大型系统扩展),可提供低成本的原子操作,改进CPU通信吞吐 。
NVIDIA声称,这种核心的能效,是如今服务器常见x86核心的2倍 。
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

Grace CPU单颗集成72个核心,互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连,而二合一的超级芯片上就是144个核心 。
每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存,一颗超级芯片的所有核心共享234MB三级缓存 。
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

内存整合封装了LPDDR5X,最大容量960GB,最高带宽1TB/s(每一颗500GB/s),还支持ECC 。
对比传统的八通道DDR5,这种设计不但带宽高出53%,单位功耗也只有1/8 。
对比海量带宽的HBM2e,单位成本只有1/3,容量则可达8倍 。
扩展支持八组PCIe 5.0 x16,总带宽1TB/s,还有用于管理的低速PCIe通道 。
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

性能方面,一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算),热设计功耗500W 。
NVIDIA对比了AMD Zen3架构的霄龙7763 64核心,双路组成128核心,号称性能可领先1.5-2.5倍,能效可领先2.0-3.5倍!
当然,AMD已经有了Zen4架构、最多96核心的霄龙9004系列,NVIDIA Grace依然还没有商用 。
NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片

【NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心】NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
文章图片