芯片|算力的阿克琉斯之踵,阿里达摩院如何破局?

“冯·诺伊曼架构存储和计算分离的模型,已无法满足人工智能应用的需求,计算存储一体化将突破AI算力瓶颈。”这是达摩院2020十大科技趋势中的技术趋势之一。
外界未预料到的是,早在这一趋势诞生之前,达摩院就已经在存算一体领域排兵布阵,暗自发力。
近日,达摩院宣布在存算一体芯片的研究上取得新突破,成功研发全球首款基于DRAM的3D键合堆叠存算一体芯片。作为一条崭新的技术分支,这颗芯片也许是芯片行业的一道曙光,但70年的冯·诺依曼攻计算体系几乎已成为行业铁律,要攻克技术和应用难题是持久战,达摩院能否破局?
芯片|算力的阿克琉斯之踵,阿里达摩院如何破局?
文章插图

计算机领域的阿克琉斯之踵
二战爆发期间,美国军方要求弹道研究实验室为陆军炮弹部队每天提供6张射表,按照当时的计算工具,需要雇佣200多名计算员至少2个月才能算完一张射表。
为此,美国集结了一群科学家,投资48万美元,最终于1946年建造完成世界上第一台通用电子计算机ENICA,实现每秒5000次加法或400次乘法的算力。这台计算机若庞然大物,功耗也在千瓦级别。
ENICA建造完成后,团队工程师冯·诺依曼写了一份报告作为反思,报告明确提到,未来的计算机应该包括控制器、存储器和运算器等组成部分,冯·诺依曼体系结构由此诞生。
冯·诺依曼体系结构意义重大,存储与计算分离的设计,不仅简化了计算机的设计,也让编程和控制变得更简单。
此后,冯·诺依曼体系结构、晶体管和布尔逻辑计算共同组成传统计算机的三大基石,和硬件之上的软件、汇编语言、编译器、应用软件共同推动计算系统向前发展。
芯片|算力的阿克琉斯之踵,阿里达摩院如何破局?
文章插图

时至今日,计算机经历半个多世纪的迭代,虽然架构上也有不少改动,但始终没能摆脱冯氏架构的束缚。
使用冯·诺依曼体系结构本身没有问题,问题在于,AI技术的长足进步,对算力需求呈爆炸式增长,虽然多核并行加速技术提升算力的有效途径之一,但在后摩尔时代,晶体管微缩逼近物理极限,芯片算力增长步履维艰。
最终,算力需求与实际增长之间的矛盾将根源指向冯·诺依曼架构存算分离的局限性。
【 芯片|算力的阿克琉斯之踵,阿里达摩院如何破局?】计算与内存分离,在计算的过程中需要不断通过总线交换数据,将数据从内存读进CPU,计算完成后再写回存储。这一运转方式让冯·诺依曼架构成为计算机领域的阿克琉斯之踵。
一方面,内存发展的速度严重滞后于处理器的发展速度,处理器的算力以每两年3.1倍的速度增长,而内存的性能每两年只有1.4倍的提升,处理器和存储器如同漏斗组合,狭窄的存储器一端极大的影响了数据传输的速度。
芯片|算力的阿克琉斯之踵,阿里达摩院如何破局?
文章插图

另一方面,数据搬运对能量消耗巨大。数据显示,数据从内存单元传输到计算单元需要的功耗大约是计算本身的200倍,真正用于计算的时间和功耗占比大大降低。
于是,业界学界在降低数据搬运开销方面下功夫,高带宽内存、高带宽数据通信、提高存储器的速度,增加片上存储等方法一一涌现,不过这些方法都没有改变数据存储和处理的方式,只是某种程度上的缓解,不能从根本上解决冯·诺依曼架构瓶颈。为此,将计算和存储合二为一的存算一体技术诞生。
实际上,这一技术早在90年代就已经被提出,但受限于技术的复杂度、高昂的设计成本以及应用场景的匮乏,过去几十年,业界对存算一体芯片的研究进展缓慢。直至近几年,英特尔、三星、美光等传统半导体公司,Facebook、谷歌等都互联网公司开始积极布局并逐渐诞生成果,也有诸如Mythic、Syntiant、知存科技、闪亿半导体等初创公司涌入这一赛道,但如今尚未有一家公司的存算一体技术解决方案受到广泛的市场认可。