最底层的硬件 , 玄铁C906是业界最早量产的向量扩展RISC-V指令集处理器 , 也是一款64位高能效处理器 , 标配内存管理单元 。针对AI处理的特点 , C906在数据预取上做了优化 , 采用多通道多模式的数据预取技术 , 可大幅提升数据访问带宽 。
编译层面 , 平头哥进一步优化神经网络模型部署工具集HHB及加速库CSI-NN2 , 二者配合 , 能简单快速的将原始单精度浮点模型量化为开发板上性能最优的数据类型 。
同时 , CSI-NN2 在实现神经网络算子时 , 充分考虑到玄铁C906的硬件特性(包括流水线、高速缓存等) , 充分挖掘了FP16 数据格式在算法中的并行能力 , 发挥出玄铁硬件的高能效优势 。
文章图片
在离开发者更近的算法层面 , 借助阿里云震旦异构加速平台利用架构感知的模型优化工具SinianML , 通过压缩、网络结构搜索、蒸馏、弹性伸缩等优化 , 使AI推理实现了计算效率的大幅提升 。同时 , 结合达摩院在语音和视觉AI算法方面的领域知识 , 在具体任务上通过算法优化实现加速 。
“在MLPerf Tiny榜单中取得4项第一 , 证明了RISC-V在性能及能效方面非常优异的潜力 , 也体现出了RISC-V在高能效AI处理中非常有价值 。”孟建熠说:“RISC-V架构更灵活 , 更能满足AIoT时代定制化需求 。”
RISC-V确立AI优势 , 将迅速占领AIoT市场
过去几年间 , 凭借着可定制化以开放开源的优势 , 比肩Arm Cortex-M0甚至Cortex-M4的RISC-V处理器产品上市 , 给Arm带来了不小的压力 。
2017 年图灵奖得主 , 也是带领伯克利加州大学团队在2011年发布RISC-V(第五代精简指令集)的David Patterson教授2020年时对雷峰网说 , “正如今天的Linux是专有操作系统的强大竞争对手一样 , 我希望开放的RISC-V架构在未来五年内成为专有处理器架构的非常强大的竞争对手 。它可能从物联网产品开始 , 但我希望RISC-V从智能手机、笔记本电脑到高性能计算 , 在各个层级都变得非常有竞争力 。”
RISC-V国际基金会董事谭章熹曾对雷峰网表示:“新的应用总会伴随新的技术和机会 , 就算不替代Arm , RISC-V架构的AI芯片无疑也是IoT时代的重要玩家 。我觉得真正有意思的是 , RISC-V开始慢慢对Arm新推出的物联网芯片进行一些替代 。”
RISC-V的AI优势在此次榜单中正是一个很好的展示 , 玄铁C906作为一款CPU , 在不借助加速器的情况下 , 就实现了比其它架构CPU配合加速器更高的AI性能 。
“平头哥的定位是提供RISC-V原生的AI支持 , 所以我们所有的基准测试都是由CPU来完成 。”孟建熠说 , “基于玄铁处理器能效的表现 , 很多对AI算力要求不高的IoT场景(1TOPS以下)就不需要在单独设计AI加速器 , 无论是成本、可调试性、可开发性都非常友好 。如果是对AI有更高要求的客户 , 也可以开发单独的AI加速器 。”
据悉 , 在语音AI场景 , 达摩院语音实验室联合平头哥打造了基于RISC-V玄铁C906核的语音交互AIoT模组 , 可以为客户整机降低一半以上的模组成本 , 同时依然保持高性能的算法体验 , 已经服务于天猫精灵等内外部客户 , 结合有25亿颗累积应用的玄铁CPU生态 , 能够为更多的智能设备带来低功耗和高性价比的AI技术 。
- 酷睿处理器|从3699跌至1769元,被遗忘的魅族开始打价格战,还能入手吗?
- 台积电|苹果第一代3nm芯片曝光:M2首发!iPhone14 A16处理器无缘
- 中兴|1899元起!中兴远航30系列现身:搭载天玑810/700处理器
- 酷睿处理器|轻薄长续航+12代酷睿+2.8K OLED,灵耀14 2022为移动商务而生
- CPU处理器|芯片代工不会降价!台积电称3nm下半年量产 2025年量产2nm
- 高通骁龙|魅族又要整活了,但不是魅族19系列,新机要等新处理器
- CPU|国产X86 CPU的电脑来了,能装windows,性能相当10年前英特尔i5
- 据此前消息|iqooneo6提前曝光:搭载骁龙8旗舰处理器
- CPU处理器|国产安卓手机砍单1.7亿部 5G芯片要降价了:便宜多达10%
- AMD|AMD自爆Zen4处理器:超频性能飞跃,第三季度就要上市