用ReRAM存算一体突围大算力AI芯片!深度对话亿铸科技CTO

用ReRAM存算一体突围大算力AI芯片!深度对话亿铸科技CTO
文章图片
智东西(公众号:zhidxcom)
作者|心缘
编辑|漠影
在AI芯片战场上 , 存算一体正火力全开 。
凭借“用存储器做计算”这一独门绝技 , 存算一体技术通过底层架构创新 , 解决了传统AI芯片长久以来难愈的痼疾——存储墙、能耗墙及编译墙 。 其发展潜能已经被学术界和工业界双双看好 。
其中有一家创企亿铸科技 , 选择了一条目前来看尚属「国内首家」的道路——研发基于ReRAM(RRAM)全数字存算一体大算力AI芯片 , 落地于云端数据中心、智能驾驶等对算力密度、能效比需求很高的应用场景 。
这支有备而来的创业新秀成立于2020年 , 经过1年时间的准备 , 自2021年10月正式运营以来 , 正在全速推进研发 。 谈及优势 , 其团队非常自信:亿铸科技不仅在ReRAM芯片设计、架构、软件、系统等方面具有国际领先的实力 , 而且可以得到从核心IP到工艺的全链国产化 。
是怎样的底气 , 支撑亿铸创始团队走上这条之前无人走过的道路?他们将如何克服技术、量产、生态等方面的诸多挑战?围绕这些问题 , 智东西与亿铸科技CTODebajyotiPal(Debu)博士进行了一场独家对话 。
Debu已深耕通信、网络和半导体行业30多年 , 因其在数字通信领域做出的开创性贡献 , 于2002年当选IEEE院士 。 他是宽带接入的先驱 , 也是AI算法及架构专家 , 曾在美国EDA巨头Cadence及美国明星AI芯片公司WaveComputing负责领导机器学习/深度学习的研发工作 , 再往前 , 还曾任高通技术副总裁 , 负责固定宽带接入技术的研发 。
经过深入交流 , Debu向我们讲述了亿铸团队在技术定位和技术战略上的深谋远虑 , 并分享了其产品研发的最新进展以及对AI芯片产业的长期观察 。
一、ReRAM商用时代已至 , 抢占云端存算一体落地先机
高能效比 , 是存算一体AI芯片的独门杀手锏 。
其实现方法不难理解 。 传统冯·诺依曼架构下存算分离 , 数据需在计算和存储单元之间频繁移动 , 数据搬运的时间甚至会达到计算时间的数百倍 , 并在此过程造成占比逾60%-90%的功耗 , 还会导致计算效率的下降 。 而存算一体架构能够从根本上突破这些瓶颈 。
存算一体技术按照计算单元与存储单元在系统中的距离可主要分为近存计算、存内计算等 。 顾名思义 , 近存计算是把存储阵列跟计算模块的距离拉近 , 而存内计算通过对存储器件进行改造 , 使得存储器件可以直接参与计算 。 两类方法均能大幅减少数据搬运 , 实现计算效率数量级的提升 。
用ReRAM存算一体突围大算力AI芯片!深度对话亿铸科技CTO
文章图片
▲冯·诺依曼、近存计算、存内计算架构对比(图源:亿铸科技)
按存储器件来划分 , 存算一体有Flash、SRAM、DRAM等成熟存储介质 , 同时ReRAM、MRAM等新型存储介质也在快速发展 。
其中 , DRAM多用于近存计算 , 适合数据中心等大算力场景;此前大部分存内计算采用模拟计算的方法 , 多选取Flash、SRAM等工艺相对成熟的存储器 。 由于难以做到足够高的精度、算力 , 这些技术方案大多被用在低功耗、低精度和中小算力的场景 。
相比之下 , 亿铸选择基于ReRAM用全数字的方式做大算力、高精度、高能效比的存算一体AI芯片 , 似乎是一个冒险之举 。
但亿铸团队并不担心 , 相反 , 这是他们经过深思熟虑做出的决定——作为业界公认的未来存储器挑大梁者 , ReRAM的商业化条件已经成熟 , 亿铸科技也准备好成为第一个“吃螃蟹的人” 。