华为鸿蒙系统|性能提升66%!AMD新款3D缓存版处理器发布

华为鸿蒙系统|性能提升66%!AMD新款3D缓存版处理器发布

文章图片

华为鸿蒙系统|性能提升66%!AMD新款3D缓存版处理器发布

文章图片

华为鸿蒙系统|性能提升66%!AMD新款3D缓存版处理器发布


在今天凌晨的活动中 , AMD发布了首款基于3D V-Cache缓存技术的服务器处理器 , EPYC Milan-X 。 系列包括四个型号 , 分别是:

EPYC 7773X 64核 (100-000000504)
EPYC 7573X 32核 (100-000000506)
EPYC 7473X 24核 (100-000000507)
EPYC 7373X 16核 (100-000000508)
其中EPYC 7773X为64核128线程 , 热设计功耗280W , 频率2.2~3.5GHz , 三级缓存容量达到768MB , 也就是在原有256MB的基础上通过3D堆叠的方式增加了512MB , 是之前的3倍 。 AMD称 , 3D缓存部分同样是台积电7nm 。 性能方面 , Milan-X在数字逻辑仿真验证中 , 比非3D缓存版提高了66% 。 目前Milan-X处理器已经得到思科、戴尔、惠与、联想、超微等认可 , 定于明年一季度出货 。

除了基于3D V-Cache堆叠缓存的处理器 , AMD还为数据中心带来了另一款神器:Instinct MI200系列加速卡(加速器) 。 这是AMD的第一款ExaScale百亿亿次级别加速卡产品 , 号称在同类产品中拥有世界上最快的HPC性能、AI性能 。

Instinct MI200系列升级为新的CDNA2计算架构 , 搭配升级的6nm FinFET工艺 , 并使用2.5D EFB桥接技术 , 业内首创多Die整和封装(MCM) , 内部集成了两颗核心 。

还有第三代Infinity Fabric总线互连技术 , 带宽100GB/s , 最多8条与第三代霄龙处理器互通 , 实现CPU/GPU内存一致性 。 软件API支持OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA 。
新系列分为两款型号 , Instinct MI250X集成了220个计算单元、14080个流处理器核心 , 最高频率1.7GHz , 并有第二代矩阵核心 , 峰值性能为:FP16半精度383TFlops、FP32单精度/FP64单精度47.9TFlops、FP32单精度/FP64双精度矩阵95.7TFlops、INT4/INT8/BF16 383TFlops 。
内存/显存搭配8192-bit位宽的128GB HBM2e , 频率1.6GHz , 峰值带宽3276.8GB/s , 并支持全芯片ECC 。
整卡采用OAM模块形态(未来也会推出PCIe扩展卡形态) , 支持PCIe 4.0 x16 , 被动散热(系统散热) , 典型功耗500W , 峰值功耗560W 。
Instinct MI250精简为208计算单元、13312流处理器核心 , 各项性能指标也顺应下降约5.5% , 其他规格完全不变 。
AMD宣称 , Instinct MI200系列性能双精度性能比竞品高出最多4.9倍 , 比上代提升最多4倍 。
【华为鸿蒙系统|性能提升66%!AMD新款3D缓存版处理器发布】