AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘( 二 )


双路配置下,每个内存通道就只能装1条了(1DPC),最多还是12条,PCIe 5.0通道对外可用则是最多160条,每路80条对外、48条用于彼此互连,另外还有12条PCIe 3.0,每路6条 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

IF高速总线升级到了第三代,最高带宽32Gbps,可选3条或4条链接,前者是默认的,此时对应的系统可用PCIe 5.0通道数量就是刚才说的160条 。
如果选择4链接,每路处理器就要贡献一半的PCIe 5.0通道用于彼此互连,留给系统可用的就是128条,这和上代是相同的 。
当然,即便同样128条,从PCIe 4.0升级到PCIe 5.0,可用带宽也是翻倍的 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

160条之多的PCIe 5.0通道能干什么?那就很随意了 。
xGMI、PCIe、SATA、CXL想怎么玩就怎么玩 。x16、x8、x4、x2、x2想怎么拆分就怎么拆分 。每一路x16都可以连接最多9个PCIe设备(一个x8和八个x1) 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

I/O性能方面,EPYC 9004支持新的高级虚拟中断控制器(AVIC),提升虚拟中断性能,并改善了中断处理吞吐量,包括CPU核心内部与SoC层面 。
搭配PCIe 4.0 x16规格的200Gbps(20万兆)网卡,默认设置下效率即可超过90%,最高达94%,单向能跑到188Gbps,双向则能跑到375Gbps 。
如果搭配PCIe 5.0 x16规格的400Gbps(40万兆) InfiBand高速网络,标准配置下效率也能超过90%,最高甚至达99%,能跑出396Gbps 。
三、内存
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

内存方面,一如桌面锐龙7000系列,EPYC 9004也仅支持DDR5,可以带来更高的频率与带宽、更低的电压与功耗、更好的电源管理(板载PMIC)、更多的通道与更低的延迟、更大的容量、更好的校验纠错(板载ECC),等等 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

EPYC 9004系列支持12个DDR5内存通道,单路最大容量6TB(单条512GB) 。
标准的4800MHz频率下,峰值理论带宽可达460GB/s 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

延迟方面,EPYC 9004略有增加,但影响不大,其中SoC约73ns、设备约45ns,总计约118ns,比上代分别增加了3ns、10ns 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

EPYC 9004还支持每路多重内存节点(NPS),可以对12条内存进行分组管理,进一步优化性能 。
四、小芯片布局
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

EPYC 9004依然是chiplet小芯片布局,其中CCD最大数量从上代的8个增加到12个,布局更加紧密,对带宽、延迟也提出了更高的要求 。
为此,小芯片间的通信通道升级为GMI3,最大带宽达到36Gbps,吞吐能力翻番,同时与内部基准频率的比例为20:1 。
针对不同数量的CCD,GMI还提供宽、窄两种模式,其中超过4个CDD为宽模式,充分利用足够的带宽,小于等于4个则是窄模式,提高效率 。