阿里|只有阿里腾讯才懂的芯片秘密( 二 )



通俗一点讲,就是让一堆Dram簇拥着计算单元,齐心协力做跟AI任务相关的神经网络计算。

阿里|只有阿里腾讯才懂的芯片秘密
文章插图

3D堆叠PIM-HBM

这一技术在2021年曾引起过存储产业内的轰动,但还尚停留在实验阶段。不过,头部存储企业已纷纷闻风而动。譬如,美光悄然为一种3D Dram技术提交了专利申请,而半导体材料巨头应用材料也迅速发布了一套3D Dram材料工程方案。

正如,EEtimes所说,这可能需要好几年,但 Dram 很可能会追随NAND的脚步,走向3D。

而阿里前段时间也曾发布过基于Dram 的3D 堆叠存算一体芯片,相关论文还被ISSCC 2022收录。当然,此为研究,并未投产,但这也是一个非常重要的信号。

阿里|只有阿里腾讯才懂的芯片秘密
文章插图


很显然,对于服务器基础架构一直十分重视的云巨头,在以肉眼可见的方式,逐步“吞噬”服务器架构中的各个核心关键点——

以亚马逊AWS为例,在2015年收购以色列的安纳普尔纳峰实验室后,便从2017年开始,陆续推出了DPU芯片Nitro、Arm服务器CPU Graviton、Graviton2及Graviton3,以及机器学习训练加速器 Trainium 和机器学习推理加速器 Inferentia。

而阿里等中国云巨头在芯片研发上获得启发的时间,恰好是在AWS发布Nitro DPU前后。如今,基本也完成了从服务器CPU到AI加速器的“同等类别装备”。

基本可以明确的是,自亚马逊开了先河后,不断垂直整合云计算从底层到上层业务,把服务器架构自研能力掌握在自己手里,如今在顶级云厂商间已经达成了共识。

“阿里的野心,或者说魄力很大。”

一位不具名的服务器专家告诉虎嗅,阿里基础架构事业群AIS,在服务器架构自研与创新走的挺快,只是因为比较底层所以外界不太了解,知乎上甚至有人直接把他们归为“做运维的”。

由于这个事业群相当于整个阿里云软硬基础设施的“管家”,所以,各类技术专家集结在一起,必须在服务器、内核、容器、JVM、调度、数据库、存储、中间件等多个数据中心“节点”上做迭代与创新,当然,它也在采购和销售上有KPI指标。

“在存储这一块,他们是有一些想法的。基本是两条路, 第一个当然是买现成的三星海力士美光,另一个是从前年开始吧,阿里自己买‘颗粒’(内存芯片),来自己做DIMM。” 他说,AIS在实验室水平上应该没问题,量产可能会有挑战。

“更重要的是看他们的整合思路——加速卡(AI, 存储)、网路(DPU/SmartNIC)。芯片是平头哥或其他部门来做,但需求方则是AIS、阿里云以及蚂蚁金服。需求方也非常重要,决定了用什么、怎么用,以及怎么用能够让效能发挥到最大。”

他提醒我们要关注英特尔 IDM2.0开放战略,特别是不久前“要对外授权X86的策略和猜测”——“我想,很多人应该很快会有动作的”。

此外,根据虎嗅近一两年来从多方了解到的信息显示,阿里在云基础设施硬件创新和战略速度层面,虽然存在部分争议,但在国内的确要胜其他云厂商两三筹。

很明显,对国内存储市场的重视和投资,无论是保证供应链稳定还是技术创新,都极为有必要。

只有云厂商才能推动的存储芯片进步

在2020年写台积电时,我们就曾提过,如果说苹果、高通、英伟达们高端产品的成功,台积电的先进制程工艺必然是最大助力之一;那么台积电总是能占领最小制程高地的原因,前者也必然功不可没——