科普|苹果M1 MAX为什么快?

自苹果秋末新品发布会 , 已有一段时日 , 但这次M1PRO/MAX新芯片的消息 , 从没停歇 。 他变强了 , 为什么强 , 强在哪儿?我们今天就来聊一聊 。
科普|苹果M1 MAX为什么快?
文章图片
▌CPU , 内核没变 , 方案改变
虽然各方面参数强的夸张 , 很夸张 , 但比较容易忽视CPU部分 , 以旗舰SoC芯片M1MAX为例:
科普|苹果M1 MAX为什么快?
文章图片
其实这代CPU内核设计和以往M1相同:
性能大核上 , 就是以前的内核做了个镜像 , 翻了个倍 , 设计上基本是一致的 。
效能小核上 , 每核的L2缓存没变 , 但核心数量少了一半 。
也就是说 , 只是方案从“4大4小”变成了“8大2小” , 要省电还是M1省电 , 但M1PRO和M1MAX的峰值性能确实比M1强了很多 。
科普|苹果M1 MAX为什么快?
文章图片
而M1PRO和M1MAX的最大区别 , 也仅仅是这下半部分GPU , 上半部分是一样的 , 就像是可以掰成两半的苏打饼干 。
也就是说 , 这次实际的设计目标就是M1Max , 而M1PRO应该是出于制造成本考虑的“物理阉割版” 。
科普|苹果M1 MAX为什么快?
文章图片
这代M1PRO/MAX单核峰值频率3228MHz , 2核3132MHz , 3~4核3036MHz , 和前代大致相同 。
小核单核峰值2GHz , 二者都不支持超线程 。
可能由于本身就很先进 , 这时候只管堆料就行 , 没必要重新设计 。
▌缓存设计 , 同 , 又不同
缓存上 , 飘哥在之前《苹果M1全网最硬核评测》中已经全面介绍过了 。
M1是“大核12MB+小核4MB”的共享L2缓存 , 已经是当时CPU里最大的缓存设计 , 同期主流X86PC的二级缓存(L2Cache)都没他大 。
科普|苹果M1 MAX为什么快?
文章图片
这代M1PRO/MAX , 要说没区别 , 也区别 。 要说有区别 , 也有区别 。
科普|苹果M1 MAX为什么快?
文章图片
由于镜像大法 , 虽说是8个(Firestorm)性能核心的CPU , 但其实是2组4核心集群 , L2缓存规模和布局没变 , 2组集群分别使用各自的12MBL2缓存(共24MB) , 并非共用一个更大的统一24MBL2缓存 。 同时 , 每组核心频率、负载也是各管各的 。
科普|苹果M1 MAX为什么快?
文章图片
但区别在于 , 性能大核心数量翻倍 , 缓存也翻倍 , 平均每核心缓存大小和以前一样 。 但(Icestorm)效能小核心虽然数量少了一半 , L2缓存大小没变 , 平均每核心缓存翻倍 , 依然是4MB , 也就是每核心从1MB变成2MB 。
科普|苹果M1 MAX为什么快?
文章图片
此外值得注意的是 , 因为规格翻番 , 所以SLCBlock缓存块也翻番 。
这个SLC不是指SLC颗粒 , 而是SystemLevelCache系统级缓存的缩写 , 可以理解为AMD的InfinityCache 。 由于是CPU、GPU、NPU共享的 , 所以位置往往位于三者之间 。
M1和和A14一样都是16MB , 而如今每一个SLCBlock都是16MB , M1PRO的2个就是32MB , M1MAX就是足足64MB 。
▌NPU , 本该翻一番 , 但可能一番没翻
比较意外的是 , 根据苹果官方宣传里 , 这次NPU性能没变 , 还是16核(11.8TFLOPS算力) 。 NPU也就是嵌入式神经网络处理器 , 特性优化设计的专用核心 , 效率比通用核心不知道高到哪里去了 。
科普|苹果M1 MAX为什么快?
文章图片
这次GPU部分虽然也做了上下对称设计 , 很多模块都是翻倍的 , 包括给H264/265硬解的视频解码单元 , M1MAX相比M1PRO也翻倍 。 但目前官方数据都是16核 , 但M1MAX芯片上也多了一个NPU部分 , 不知道最终性能有什么变化 。