ReRAM 「存算一体」应用于AI大算力的新思路

ReRAM 「存算一体」应用于AI大算力的新思路
文章图片
亿铸科技以全数字的技术思路将ReRAM“存算一体”应用于AI大算力领域 , 它能否打破传统冯诺依曼架构下的存算墙、能耗墙和编译墙?
在我国西部 , 一座座数据中心正在拔地而起 , 为全国输送着源源不断的算力 。 但数据计算往往伴随着巨大的功耗 , 因此发展数据中心和实现“双碳”目标之间存在着巨大的矛盾 。 在“碳中和”已经成为全球共识的当下 , 国家在近段时间推出的“东数西算”工程受到了社会各界广泛关注 。 “东数西算”通过在全国布局8个算力枢纽 , 引导大型、超大型数据中心向枢纽内集聚 , 形成数据中心集群 , 以此优化资源配置 , 提升资源使用效率 。 虽然“东数西算”为优化数据中心的供能结构提供了政策助力 , 但并不能从技术层面解决既有算力能效比和算力能耗绿色发展需求之间的根本矛盾 。 计算芯片的功耗向来是芯片制造工艺演进中备受关注的指标之一 。 在后摩尔时代 , 单纯通过工艺制程的提升降低芯片功耗的路径也日渐捉襟见肘 , 已经接近摩尔定律的物理极限 。 此外 , 巨大的生态依赖性也牵扯着各个AI应用场景的发展进程 。
但随着基于ReRAM的全数字存算一体架构大算力、低功耗、易部署芯片的研发和产业化 , 这一难题似乎有了新的解决思路 。
ReRAM 「存算一体」应用于AI大算力的新思路
文章图片
存算一体打破“存算墙”和“能耗墙”
在芯片产业发展的过程中有两座绕不开的大山:“存算墙”以及“能耗墙” 。
1946年 , 美籍匈牙利科学家冯·诺依曼(J.VonNeumann)提出了著名的存储程序原理 , 此后70余年 , 现代计算机发展到第五代 , 存储器经历磁存储 , 光存储等一路发展至半导体存储 , 而冯·诺依曼结构是当下最主流的计算机结构的地位却从未变过 。 但随着时代的飞速进展 , 存算分离结构的天生缺陷使得冯·诺依曼结构的电子计算机似乎已经难以满足数据处理更海量、更快速、更低耗的需求 。
为什么说冯·诺依曼结构存在天生的缺陷?这是因为在该结构设计中 , CPU访问存储器的速度决定了系统运行的速度 , 这也使得系统对存储器产生了绝对的依赖 。 随着半导体技术快速发展 , CPU的运算速度已经远远超过了访存速度 , 前者通常是后者的200倍以上 , CPU在执行指令间不得不等待数据 。 CPU和内存之间的数据传输带宽 , 以及传输过程中每一层代码的手动优化 , 都成为限制计算机性能进一步提高的瓶颈 , 带来“存算墙”问题 。
而AI计算在处理大量数据的过程中 , 这些数据需要在计算和存储单元中进行频繁的移动 , 移动受制于关键部件的技术瓶颈 , 也带来了芯片面积增加、接口IP成本增加、功耗增加等一系列问题 , 也就产生了“能耗墙”问题 。
尤其当工艺制程的发展开始进入后摩尔时代 , 业界对于解决这一问题的全新的技术路线显得更加渴求和迫切——于是 , “存算一体”便被提了出来 。 这是一种将存储和计算有机结合的非冯诺依曼架构 , 理论上计算可以直接在存储器中进行 , 这样既打破了系统对于存储器的绝对依赖 , 还能够极大地消除数据搬移带来的开销 , 彻底消除“存算墙”以及“能耗墙”的问题 。
ReRAM 「存算一体」应用于AI大算力的新思路
文章图片
新型存储ReRAM , 实现存算一体的最优解
既然理论上是可行的 , 那么实际又该如何实现存算一体呢?
大体上看 , 市面上大概有三个流派的方案实现存算融合:一是利用先进封装技术把计算逻辑芯片和存储器(如DRAM)封装到一起 , 以高IO密度来实现高内存带宽以及较低的访问开销 , 或采用更先进的制程工艺 , 比如2.5D、3D的封装以及高位宽的HBM接口等 , 实现近内存计算;二是在传统DRAM、SRAM、NORFlash、NANDFlash中实现存内计算;三是利用新型存储元件实现存算一体 。