在指令集架构的世界里,X86、Arm、RISC-V虽然长期各自的擅长的领域各自为政,但近年来在数据中心领域的竞争愈发明显,Arm阵营向服务器市场发起猛烈进攻,企图与x86和Arm正面抗衡的服务器级别的RISC-V CPU也在2022年底亮相,预计2023年中出货 。
内部竞争加剧加上外部局势动荡,过去一年英特尔数据中心业务频频下滑,市场表现不如预期,急需更具竞争力的服务器改变救火 。
1月11日,英特尔正式发布第四代至强可拓展处理器(代号“Sapphire Rapids”),同时推出英特尔至强CPU Max系列(代号“Sapphire Rapids HBM”)以及英特尔数据中心GPU Max系列(代号“Ponte Vecchio”),该系列产品家族有何性能优势?能否在未来助力英特尔夺回数据中心处理器第一的宝座?
新添七大算力神器,堆核不是唯一的解
“自2017年英特尔推出了第一款至强可扩展处理器以来,英特尔已经向全球客户交付了超过8500万颗至强可扩展处理器,支持着全世界的数据中心 。
其中,在过去两年,第三代英特尔至强可扩展处理器已全球累计出货1500万颗 。”英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰在发布会上对英特尔至强处理器过去的成绩总结道 。
英特尔第四代至强可扩展处理器采用Intel 7制程工艺制造,具有全新的芯片架构,其支持每个插槽最多60个内核,及每个系统1、2、4或8个插槽,每个插槽有80个PCIe Gen5通道,搭配DDR5内存和CXL 1.1等新技术,以支持高带宽和附加加速器效率 。
文章图片
值得注意的是,与上一代相比,第四代英特尔至强可扩展处理器除了核心数的持续增加外,新的内置加速器,涉及人工智能、科学计算、安全、网络、数据分析、存储等领域,性能较前一代平均提升1.53倍 。
英特尔认为,从行业应用需求到真实物理世界的局限性,仅靠核心频率和核心数量的增强,将不能满足其在真实工作负载下对CPU性能更高的追求,所以引入全新的针对实际工作负载优化加速的设计理念,采用系统级设计方法,在CPU芯片架构中内置专用的工作负载加速器,以提升性能和效率 。
在发布会上,庄秉翰将处理器内置的加速器总结为七大算力神器:
英特尔高级矩阵扩展(英特尔AMX)
可以大幅度提升深度学习工作负载的性能,例如推荐系统、自然语言处理、图像识别、媒体处理和交付,以及媒体分析 。与上一代(FP32)相比,内置英特尔高级矩阵扩展(英特尔AMX)(BF16)的PyTorch实时AI推理和训练性能提高了10倍 。结合通用CPU计算单元,第四代英特尔至强可扩展处理器可以端到端运行任何AI工作负载 。
英特尔动态负载均衡器(英特尔DLB)
【AMD|不拼核战 intel第四代至强CPU如何稳住数据中心王座?】支持在多个CPU内核及线程间高效分布网络工作负载,实现分布式处理,并在负载不平衡时,动态地将数据负载重新分配到各个CPU内核上,实现动态负载均衡 。还可以调整CPU内核上同时处理的网络数据包的顺序,实现动态网络处理重排序,从而达到更高的整体系统性能 。与前一代处理器相比,在相同功率范围下,vRAN工作负载的容量提升高达2倍 。
英特尔数据流加速器(英特尔DSA)
帮助用户在存储,网络和数据分析中实现更快速的数据移动而增添的加速器,有助于加快CPU、内存、缓存以及存储和网络设备之间的数据移动,释放CPU性能并降低时延,提高用户对CPU内核的利用率,可将性能提升1.7倍 。
- AMD|谷歌、微软搜索引擎“作恶”A饭注意了:小心假冒AMD驱动
- AMD|真羡慕,有人为你准备春节礼物
- AMD|Zen4架构锐龙7000也不好卖 消息称AMD砍单5nm芯片
- 1月12日消息|amd锐龙7000x3d定档2月14日上市
- AMD|AMD出招,英特尔最不想看到的对手来了
- 显卡|PC市场“大清洗”,AMD活成唯一希望?
- AMD|性能领先24核i9多达24% AMD锐龙7000 3D缓存版闹乌龙:情人节没戏
- 存储|仅1.5Kg 群晖最小NAS DS723+发布:双盘位 AMD处理器
- 显卡|AMD击杀RTX 4080/4070 Ti!RX 7900 XT/XTX国内随便买了:7399元起
- AMD|AMD RDNA3显卡架构底层细节公开!606页 应有尽有