AMD|60核120线程 Intel首个Chiplet处理器正式发布:售价达1.7万美元( 三 )


AMD|60核120线程 Intel首个Chiplet处理器正式发布:售价达1.7万美元
文章图片

英特尔还将其快速辅助技术 (QAT:Quick Assist Technology) 加速器带入了 CPU 。此功能过去驻留在芯片组上 。该硬件卸载加速器增强了加密和压缩/解压缩性能 。
英特尔使用 QAT 加速器已有一段时间,因此该技术已经享有广泛的软件支持 。
AMD|60核120线程 Intel首个Chiplet处理器正式发布:售价达1.7万美元
文章图片

不幸的是,这些芯片具有不同的加速能力——你不能在所有型号上购买四个“设备” 。Sapphire Rapids 处理器由两种类型的设计(Die Chops)组成,如 SKU 表中所列 。
XCC 芯片由四个die组成,每个die都有一个加速器(IAA、QAT、DSA、DLB) 。这意味着您最多可以在这些芯片上激活每种类型的四个加速器(例如,4 个 IAA、4 个 QAT、4 个 DSA、4 个 DLB) 。
相比之下,一些芯片使用单个 MCC die,因此它们只有一个 IAA 和 DSA 加速器以及两个 QAT 和 DLB 加速器(2 个 QAT、2 个 DLB、1 个 IAA、1 个 DSA) 。
Intel Max CPU 系列和 Ponte Vecchio Max GPU 系列
英特尔最近公布了有关其即将推出的至强 Max 系列 CPU 和英特尔数据中心 GPU Max 系列(Ponte Vecchio) 的详细信息 。今天标志着正式启动 。
英特尔配备 HBM2e 的 Max CPU 型号上市,具有 32 至 56 个内核,并基于标准的 Sapphire Rapids 设计 。这些芯片是第一批采用 HBM2e 内存封装的 x86 处理器,从而为处理器提供了更大的 64GB 本地内存池 。
HBM 内存将有助于处理对内核数量不那么敏感的内存绑定工作负载,因此 Max 型号的内核数量少于标准型号 。
目标工作负载包括计算流体动力学、气候和天气预报、人工智能训练和推理、大数据分析、内存数据库和存储应用程序 。
AMD|60核120线程 Intel首个Chiplet处理器正式发布:售价达1.7万美元
文章图片

Max CPU 可以在多种配置下运行,例如将 HBM 内存用于所有内存操作(仅 HBM - 不需要 DDR5 内存),将 HBM 呈现为单独内存区域的 HBM“平面模式”(这需要广泛的软件支持),或者在使用 HBM2e 作为 DRAM 支持的缓存的 HBM“缓存模式”中 。后者不需要更改代码,很可能是最常用的操作模式 。
Xeon Max CPU 将与AMD 的 EPYC Milan-X 处理器相抗衡,后者带有一个称为 3D V-Cache 的 3D 堆叠 L3 缓存 。Milan-X 模型每个芯片具有高达 768MB 的总 L3 缓存,可提供令人难以置信的带宽量,但它提供的容量不如英特尔的 HBM2e 方法 。这两种方法各有优缺点,因此我们迫不及待地想对 Xeon Max 处理器进行测试 。
值得注意的是,富士通的 A64FX Arm 处理器使用了类似的 HBM 技术 。配备 HBM 的 A64FX 处理器为 Fugaku 超级计算机提供动力,该超级计算机多年来一直是世界上最快的(直到去年由AMD 驱动的百亿亿级 Frontier接管) 。Fugaku 仍然保持在 Top500 的第二位 。
英特尔还推出了之前代号为 Ponte Vecchio 的 Max GPU 系列 。英特尔此前推出了三种不同的 GPU 型号,它们均采用标准 PCIe 和 OAM 外形规格 。
英特尔傲腾持久内存 (PMem) 300
作为 Sapphire Rapids 发布的一部分,英特尔悄悄推出了最后一个系列的傲腾持久内存 DIMM 。最后一代代号为 Crow's Pass 但正式名称为 Intel Optane Persistent Memory 300,将提供 128、256 和 512 GB 容量,并以 DDR5-4400 运行 。这比之前的 DDR4-3200 峰值有了很大的改进,但这也意味着如果 Sapphire Rapids 系统计划使用傲腾,则必须将标准内存从支持的 DDR5-4800 降频到 DDR5-4400 。