|“清华帮”组队创业,要打破芯片能效天花板,对话苹芯科技CEO( 三 )


三、创业半年 , SRAM存内计算加速器测试成功什么对苹芯是更有意义的?
为了回答这个问题 , 苹芯团队走访了很多客户 , 了解对方的痛点、对技术的要求 , 以及能利用技术实现什么核心价值 。
“我们一直对技术抱有敬畏之心 , 在战略层面沿着先做技术、再做平台、然后做产品的思路 , 发展过程中几条腿同时走路 。 ”杨越相信比起与巨头狭路相逢 , 初创公司的机会更多是在细分领域中 , 能够快速迭代 , 了解新领域的know-how , 快速满足用户的刚需 。
令杨越很有成就感的是 , 苹芯的团队氛围非常融洽 。 “我能感觉到大家每天都是非常希望来上班的 , 工作目标、职业规划都制定得很清晰 。 ”
在他眼中 , 这是一群特别靠谱的工作伙伴 。
作为一家初创公司 , 苹芯必须保持很快的流片节奏 。 第二款芯片流片测试完成后 , 大家非常淡定 , 出去吃了顿简单的庆功宴 , 便马不停蹄地开始推进下一个研发任务 。
2021年9月7日 , 苹芯科技宣布其基于SRAM架构的存内计算加速器S200已经测试成功 。 它可以将深度学习算法中占主导的基本运算在存储器内完成 , 能大幅提升计算效率 , 并能完成无损精度的运算 。 苹芯团队称 , 这款加速器「首次将商用存内计算带入28nm时代」 。

▲S200芯片性能参数概览该成果还发表在有“固态电路领域奥林匹克”之称的芯片顶会ISSCC 2022上 。 其32Kb无ADC架构SRAM存内计算加速单元基于28nm工艺搭建模块 , 能效比高达27.38TOPS/WINT8 , 同时实现1.041Mb/mm2的高面效比 。
而在同等条件下 , 世界上多数加速器测试结果 , 通常介于2-3TOPS/W之间 。
足足将能效比提升10倍 , 苹芯是怎么做到的?
四、两大技术优势 , 三个未来目标苹芯的存内计算加速器S200有两大技术优势:28nm工艺和全数字化设计 。
杨越说 , 选择28nm是综合考虑的决定 。 先进节点固然能带来更高性能 , 但也意味着更高的流片和量产成本 , 这与端侧芯片对成本的苛刻要求相矛盾 。 28nm则相对成本更低 , 同时也能展现出SRAM向高级制程节点兼容性好的优势 。
此外 , 多家晶圆代工厂具备28nm制造能力 , 在供给产能方面更加稳定和充裕 。
S200的另一重优势 , 是全数字化设计 。
以前存内计算芯片主要是模拟芯片 , 优势是能效高 , 但会牺牲一定精度 。 而苹芯研发的无ADC架构SRAM存内计算加速单元 , 不仅能保障精度 , 能效性也能做到更加领先 。 除了整型数据的支持外 , 杨越提到浮点数据也在苹芯的技术支持范围内 , 处于持续优化验证的过程中 。

▲苹芯科技存算一体AI芯片实物照片软件研发同样是AI芯片公司的战略重心 。
据杨越观察 , 端侧客户相对没那么关心芯片底层设计 , 他们更在乎端侧芯片的实际表现 , 包括性能、成本以及好不好用 , 有三种常见诉求:一是易用性 , 即上手不费劲;二是可定制性 , 客户可能有自己的算子 , 有二次开发需求;三是可扩展性 , 当硬件计算能力升级 , 软件不能成为瓶颈 。
苹芯也非常重视软硬件协同工作 , 定义有自己的指令集 , 并围绕上述诉求展开研发 , 既支持做定制 , 又顾及升级至数百TOPS板卡时的支持 。 杨越透露说 , 苹芯还在做Turnkey方案的准备 。
为了公司能够坚持自有发展战略规划的实施 , 苹芯在初期客户与合作伙伴的选择上非常慎重 , 除了发展理念的契合 , 还会考虑客户业务需求面临的痛点是否主要由传统冯·诺依曼架构的瓶颈导致 。 现阶段 , 他们希望能通过更多实践 , 能够充分展现存内计算技术的优势 , 让这一先进技术能够真正扎根于实际应用 , 并拓展更宽广的未来 。