科普|苹果M1 MAX为什么快?( 二 )


▌512bit内存 , 离谱的快
这次最恐怖的就是内存性能 。 苹果依旧使用UMA统一内存架构 , 也就是内存和显存共用 , 降低延迟和带宽需求 , 提升效率 。 其实在M1之前 , A12X就已经用这种方案了 。
科普|苹果M1 MAX为什么快?
文章图片
颗粒就焊在芯片的内存控制器边上 , 距离越近 , 延迟越低 。 上代M1是双通道LPDDR4X4266MHz128bit(2x64bit) , 1.5V电压 。
科普|苹果M1 MAX为什么快?
文章图片
如今直接用上了LPDDR5 , 由于DDR5单Die双通道的特性 , 实际可以理解为每片颗粒内部是2x64bit=128bit位宽 , 因此内存位宽为:
M1PRO是2x2x64bit=256bit
M1MAX是4x2x64bit=512bit
也就是说 , M1MAX不是说看着有4片Die就是4通道 , 实际是等效8通道 。 按照最大512bit位宽来算 , “等效工作频率x位宽/8=带宽” , 而他的内存频率为6400MHz(≈6400MT/s) , 那么:
6400MT/sx512bit/8=409.6GB/s
科普|苹果M1 MAX为什么快?
文章图片
岂止是远超M1的68.25GB/s , 这已经是3995WX配8通道DDR43200内存的两倍内存性能了...接近海力士的HBM2E内存(460GB/s) 。
科普|苹果M1 MAX为什么快?
文章图片
另外这代由于内存通道变多 , 参考M1实际平台内存延迟有96ns , 这代的延迟可能会更高 。
此外内存控制器分配缓存为48MB , 大缓存也可以抵消一些延迟带来的影响 。 内存控制器肯定是更新更强的 , 布线也经过全面改动 ,
科普|苹果M1 MAX为什么快?
文章图片
由于内存共享显存 , 相较于3080、3090这些GDDR6X显存动辄一百多ns的延迟 , 其实还是低的多的 。
当然 , 由于电压从上代的1.5V降低到了1.1V , 内存/显存功耗会降低不少 , 这代最大64G统一内存/显存 , 省电的同时 , 显然也不会爆显存 。
科普|苹果M1 MAX为什么快?
文章图片
反观RTX3090上那24G的高功耗GDDR6X显存 , 容量相较之下小的多 , 但约120W的显存功耗 , 甚至都比别人一台笔记本电脑平台功耗都高了...(不过GDDR6X的带宽确实更大)
▌GPU显示核心
GPU方面 , 也是肉眼可见的翻倍 , M1PRO的规模比M1大一倍 , M1MAX比M1PRO又更大一倍 。
科普|苹果M1 MAX为什么快?
文章图片
从8核 , 提升到16核和32核GPU 。 同时翻番的还有TMUs纹理单元、ROPs光栅单元 。
根据以往评测 , M1的GPU稍低于RX560的水准(Metal下相比DX12有额外性能损失) , 那么四倍于这个性能 , 那刚好就稍低于桌面端3060或者2070差不多了 , 基本符合官方宣传图里那个暗示3080Max-Q的图表 。
科普|苹果M1 MAX为什么快?
文章图片
M1MAX的GPU包含256个TMUs、128个ROPs、4096个ALUs也就是流处理器 。 GPU核心频率1278MHz ,
科普|苹果M1 MAX为什么快?
文章图片
单精度浮点性能10.4TFLOPS , 功耗约70W 。 对比其他浮点性能接近的显卡 , M1MAX确实有着最低的功耗 , 极其离谱的能耗比 。
科普|苹果M1 MAX为什么快?
文章图片
根据Anandtech的测试 , 在GFXBench5.0AztecRuins测试中 , 这块GPU实际表现介于6800M和3080低功耗版之间 。
科普|苹果M1 MAX为什么快?
文章图片
但对于Affinity基准测试这类专业应用 , M1MAXGPU(32891分)在部分任务中甚至超越了AMDRadeonProW6900X(32580分)这档专业卡 ,