armv9-a指令集打造的ip核心到底有多强

ARM在2011年发布的ARMv8-A指令集见证了智能手机的崛起 , 至今已经衍生出了ARMv8-A、ARMv8.1-A、ARMv8.2-A~ARMv8.6-A共七个版本 。
armv9-a指令集打造的ip核心到底有多强
文章图片
其中 , 从Cortex-A75~Cortex-A78/X1 , 均是基于ARMv8.2-A打造 , 而苹果AppleA12/A13和A14则分别基于ARMv8.3-A和ARMv8.4-A指令集架构设计 , 苹果自研的A系列芯片始终强于同期的原生Cortex-A架构 , 更先进的指令集也在背后出力不少 。
armv9-a指令集打造的ip核心到底有多强
文章图片
然而 , 历经10年的开发 , ARMv8-A指令集的潜力以及挖掘殆尽 。 为了未来10年计算设备的发展考虑 , ARM在前不久发布了全新的ARMv9指令集(详见《ARMv9影响下一个十年!一文了解ARM指令集发展史》) 。
如今 , ARM再度祭出了首批基于ARMv9-A指令集打造的IP核心 , 它们便是超级核心Cortex-X2、大核心Cortex-A710和小核心Cortex-A510 , 分别取代现有的Cortex-X1、Cortex-A78和Cortex-A55 。
armv9-a指令集打造的ip核心到底有多强
文章图片
同时 , ARM还带来了与这些IP搭配的MaliGPU , 而且还是Mali-G710、Mali-G610、Mali-G510、Mali-G310一大家子 。
armv9-a指令集打造的ip核心到底有多强
文章图片
那么 , 上述这些CPU和GPU核心到底有多强 , 是否值得我们期待?
超级核心Cortex-X2
和基于ARMv8-A指令集打造的Cortex-X1相比 , Cortex-X2除了指令集升级到ARMv9-A , 还对分支预测与预取单元、流水线长度、乱序执行窗口、FP/ASIMD流水线、载入存储窗口和结构等方面进行了优化 。 此外 , Cortex-X2仅支持AArch6464位指令而不再兼容32位应用 。
作为普通消费者 , 咱们没必要探求底层的细节 , 只需要知道Cortex-X2相比于X1的整数性能提升16% , AI机器学习性能(ML)则可以翻一番即可 。
armv9-a指令集打造的ip核心到底有多强
文章图片
需要注意的是 , ARM公布的对比数据存在水分 , Cortex-X2的三级缓存为8MB , 但与其对比的Cortex-X1三级缓存却只有4MB , 要知道满血的Cortex-X1也是支持8MB缓存的 。
但即便如此 , 超过10%的IPC性能提升也是可以接受的 , 只是希望Cortex-X2能在功耗和发热方面有所优化 , 在搭配现有的5nm工艺时不要因过热降频而拉胯 。
大核心Cortex-A710
原本我们以为ARM今年的大核心IP会叫Cortex-A79 , 没想到一下子进入了3位数的后缀时代 。 全新的Cortex-A710只这代IP中唯一继续支持OL0AArch32的核心 。 这意味着 , 当你打开某个32位的老旧APP时 , 无论它处于前台还是后台挂起状态都会触发Cortex-A710大核以高功耗运行 。 因此 , 如果你希望手机可以更省电 , 未来手机里就不要安装老应用了 。
armv9-a指令集打造的ip核心到底有多强
文章图片
根据ARM的数据显示 , 在同制程工艺和频率的情况下 , Cortex-A710相比Cortex-A78的IPC性能提升10% , 或者可以将功耗降低30% , AI机器学习性能也可以翻倍 , 提升幅度相对Cortex-X2和X1要小一些 。
小核心Cortex-A510
作为小核心的Cortex-A510与Cortex-X2一样均只支持AArch6464位指令 , 无法运行32位程序 。 作为已经发布4年的Cortex-A55的接班人 , ARM对Cortex-A510进行了特别关照 , 它不仅借鉴了Cortex-X系列在分支预测、数据预取方面的一些技术 , 还引入了“合并核心”(merged-core)的新设计 , 可以将2个核心组合在一起 , 每个核心都有自己完整的前端、核心、整数后端、一级缓存 , 只是共享了最大512KB的二级缓存和FP/NEON/SVE流水线 。