2022年3月的GTC技术大会上,NVIDIA正式发布了首款数据中心CPU——Grace,同时打造了两颗超级芯片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一 。
文章图片
Grace CPU二合一
文章图片
Grace CPU+Hopper GPU二合一
现在,NVIDIA官方详细揭示了Grace Superchip超级芯片的设计与性能、能效 。
它通过NVLink-C2C芯片间互连总线,将两颗Grace CPU整合在一块基板上,彼此之间的双向带宽多达900GB/s 。
文章图片
Grace CPU基于Armv9-A 9.0架构、Neoverse V2 64位内核,以4个128-bit功能单元的方式配置了两组SIMD矢量指令集,一是SVE 2(缩放矢量扩展第二版),二是NEON(高级SIMD) 。
它还支持LSE(大型系统扩展),可提供低成本的原子操作,改进CPU通信吞吐 。
NVIDIA声称,这种核心的能效,是如今服务器常见x86核心的2倍 。
文章图片
文章图片
Grace CPU单颗集成72个核心,互相通过3.2TB/s超高带宽的NVIDIA缩放一致性Fabric总线互连,而二合一的超级芯片上就是144个核心 。
每核心64KB一级指令缓存、64KB一级数据缓存、1MB二级缓存,一颗超级芯片的所有核心共享234MB三级缓存 。
文章图片
内存整合封装了LPDDR5X,最大容量960GB,最高带宽1TB/s(每一颗500GB/s),还支持ECC 。
对比传统的八通道DDR5,这种设计不但带宽高出53%,单位功耗也只有1/8 。
对比海量带宽的HBM2e,单位成本只有1/3,容量则可达8倍 。
扩展支持八组PCIe 5.0 x16,总带宽1TB/s,还有用于管理的低速PCIe通道 。
文章图片
性能方面,一颗超级芯片的FP64双精度峰值浮点性能可达7.1TFlops(每秒7.1万亿次计算),热设计功耗500W 。
NVIDIA对比了AMD Zen3架构的霄龙7763 64核心,双路组成128核心,号称性能可领先1.5-2.5倍,能效可领先2.0-3.5倍!
当然,AMD已经有了Zen4架构、最多96核心的霄龙9004系列,NVIDIA Grace依然还没有商用 。
文章图片
【NVIDIA|NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心】
文章图片
- 显示器|打工一年享受享受怎么了 HKC 27寸4K 144Hz显示器3449元
- NVIDIA|黄仁勋早年“承诺”被扒出:让显卡越来越便宜!
- NVIDIA|核心、显存砍得没法看!RTX 4060 Ti只能追上RTX 3070
- 看懂这25个核心概念,就没有啃不动的机器学习论文
- NVIDIA|144核 NVIDIA最强CPU芯片架构深入解读
- NVIDIA|NVIDIA GeForce NOW云游戏获性能升级:每月135元体验RTX 4080你用么
- CPU|像photoshop一样分解工作,从工作的核心区开始
- NVIDIA|NVIDIA史上最鸡肋、还特长寿的显卡:GeForce MX终于要走了!
- AMD|不是高温 就是烧了:AMD、NVIDIA真是卧龙凤雏啊!
- NVIDIA|移动版RTX 4090性能首曝:飙升263.1%