?存算一体:NOR Flash冲向新巅峰

?存算一体:NOR Flash冲向新巅峰
文章图片
近年来 , 在算力急速增长的推动下 , 以神经网络为代表的人工智能迎来了新一轮的发展 , 并迅速在图像视频应用、自然语言处理及其他诸多领域取得了惊人的成就 。 尤其是边缘计算在终端设备推理的兴起为人工智能提供了大量的计算设备和数据 , 使得人工智能具有了无限的可能 。 但是 , 神经网络对于庞大算力的需求和边缘及终端侧对于低功耗的需求之间难以调和的矛盾 , 严重阻碍了神经网络的进一步发展和应用 , 因此低功耗、高能效神经网络加速器成为了众多企业、研究机构的研究重点 。 在这样的基础上 , 存算一体孕育而生 。
为什么需要存算一体?
2018年 , 美国DARPA“电子复兴计划”明确提出不再依赖摩尔定律的等比例微缩道路 , 旨在寻求超越传统冯·诺依曼计算架构的创新 , 利用新材料、新器件特性和集成技术 , 减少数据处理电路中移动数据的需求 , 研究新的计算拓扑架构用于数据存储与处理 , 带来计算性能的显著提高 。
与传统的计算单元和存储单元分离的冯诺依曼架构不同 , 存算一体技术可以把存储单元同时用于计算和存储 , 这样就可以避免数据和计算结果在计算单元和存储单元之间来回搬运引起的功耗和带宽瓶颈 , 从而实现功耗的大大降低 。
基于NORFlash的存算一体
而基于NORFlash的存算一体方案正是受到多方关注的一条技术路线 。 英特尔、博世、美光、LamResearch、应用材料、微软、亚马逊、软银都投资了基于NORFlash的存内计算芯片 。
NORFlash的起源和技术发展
Nor是Flash一种架构方式 。 Flash存储技术是在它之前的E2PROM(ElectricallyErasableProgrammableReadOnlyMemory)基础上发展起来的存储器,它跟E2PROM一样,也是使用电学方法来存储电荷的器件,只是E2PROM是使用两个晶体管来构成 , 而Flash存储阵列中的存储单元是由一个晶体管组成的 。 所以Flash存储器在器件集成度、数据容量和功耗低等性能上都比之前的器件有明显的提高 。
目前性价比最高的存储器首推闪存,闪存主要有NOR和NAND两种类型 。 NORFlash由英特尔公司于1988年最初推出 。 为了提高容量/价格比 , 东芝公司于1989年推出NANDFlash 。 但相比NORFlash来说 , 两种Flash技术各有优、缺点以及各自适用的场合 。 NOR结构的特点是芯片内执行(XIP,eXecuteInPlace),这样应用程序可以直接在Flash闪存内运行,不必再把代码读到系统RAM中 , 节省了时间 。 NAND结构的特点能提供极高的单元密度,可以达到高存储密度,并且增加写入和擦除的速度 。
NORFlash的原理
?存算一体:NOR Flash冲向新巅峰
文章图片
浮栅晶体管的横截面
NORFlash的存储单元是浮栅晶体管 , 在作为存储使用的时候每个浮栅晶体管可以存储1bit数据 。 它是在金属-氧化物半导体场效应晶体管(MOSFET)的基础上引入浮置栅极来存储电荷而实现的 。 一个浮栅晶体管 , 由P型的衬底和在其上重掺杂的N型源极和漏极、控制栅极、由氧化物包围的多晶硅浮栅组成 。 浮栅是由绝缘介质层包裹起来的 , 浮栅和沟道之间的很薄的氧化物层被称为隧道氧化层 , 两个多晶硅栅之间的氧化物层被称为栅氧化层 , 一般是氧化物-氮化物-氧化物层组成的多晶桂层间绝缘介质 。 因此 , 其上的电荷会轻易地流失 , 因而浮栅晶体管能够应用于NVM 。
浮栅和控制栅可以用来控制源极和漏极之间沟道的形成:当浮栅处于无电荷状态时 , 浮栅晶体管会如MOSFET—样 , 当控制栅加高于阈值电压(ThresholdVoltage)的电压时 , 沟道形成 , 浮栅晶体管处于导通状态 , 而控制栅上加的电压低于阈值电压时 , 浮栅晶体管处于截止状态;当浮栅上存储一定量的电子后 , 由于浮栅的影响 , 会升高 , 浮栅晶体管更加难以导通 。 这样 , 就可以通过这两种状态来存储数据 , 分别表示“1”和“0” , 并且可以通过在栅极上加一个在两种之间的电压 , 根据流过的电流来读取存储在浮栅晶体管中的状态 。