出门问问|苹果发布M1 Ultra芯片:1140亿晶体管、20核CPU+64核GPU

出门问问|苹果发布M1 Ultra芯片:1140亿晶体管、20核CPU+64核GPU

文章图片

出门问问|苹果发布M1 Ultra芯片:1140亿晶体管、20核CPU+64核GPU
"multi_version":false随着Mac Studio的发布 , 苹果也推出了最新的M1系列芯片:M1 Ultra 。 这是苹果及其M1系列芯片的巨大飞跃 , 通过名为UltraFusion的创新封装架构 , 苹果将两个M1 Max芯片互联在一起 , 创建了前所未有的性能和功能水平的SoC , 为Mac Studio提供了惊人的计算能力 。

M1 Ultra由1140亿个晶体管组成 , 是个人计算机芯片有史以来最多的一款产品 。 苹果为M1 Ultra配置了高达128GB的高带宽(达到800 GB/s)、低延迟统一内存 , 加上最高的20核CPU(16个性能内核+4个能效内核)、64核GPU和32核NPU , 为开发人员提供了无可比拟的性能 , 承担以往难以完成的3D渲染工作 。 与此前的M1 Max芯片一样 , 每个性能内核拥有192KB指令缓存、128 KB数据缓存和共计48MB的L2缓存 , 每个能效内核拥有128KB指令缓存、64KB数据缓存和共计8MB的L2缓存 。
在去年苹果推出M1 Max芯片以后 , 就有人通过对其的研究 , 发现M1 Max具有未被发现的互联总线 , 可以支持通过特定的中介层和多芯片封装 , 理论上就可以实现堆叠 。 由此断定未来苹果可能会基于M1系列芯片的架构 , 持续地进行扩展 。 这次M1 Ultra的出现 , 也印证了这种想法是正确的 。

为了构建M1 Ultra , 苹果采用了定制的封装架构UltraFusion , 以实现两个M1 Max芯片的连接 。 这种方法解决了双路主板配置双CPU带来的增加延迟、减少带宽和功耗增加的问题 , 并且可以将两个芯片识别为一个CPU , 让开发人员能够更充分地利用其性能 。 M1 Max的中介层有超过10000个信号引脚 , 以此提供了2.5 TB/s的处理器间低延迟带宽 , 是目前最好的多芯片互连技术带宽的四倍以上 。
64核GPU也让图形性能得到了大幅度的提升 , 共计8192个执行单元 , 单精度浮点计算能力为21 TFLOPs , 纹理填充率为660 GTexels/s , 像素像素填充率为330 GPixels/sM1 Ultra的32核NPU可以每秒进行高达22万亿次运算 , 加速完成最具挑战性的机器学习任务 。
M1 Ultra的媒体引擎支持硬件加速H.264、H.265、ProRes、ProRes RAW , 带有两个视频解码引擎、四个视频编码引擎、以及四个ProRes编解码引擎 。 其性能也达到了M1 Max的两倍 , 提供了更高的ProRes视频编码和解码吞吐量 , 让Mac Studio可以播放多达18个8K ProRes 422视频流 。 M1 Ultra还集成了定制的技术 , 比如能够驱动多个显示器的显示引擎和集成了Thunderbolt 4控制器 , 此外还具备一流的安全功能 , 包括苹果最新的Secure Enclave、硬件验证的安全启动和运行时的反利用技术 。

苹果硬件技术高级副总裁Johny Srouji表示:
“M1 Ultra是苹果又一个改变游戏规则的芯片 , 将再次震撼PC行业 。 通过将两个M1 Max芯片与UltraFusion封装架构相连接 , 让我们能够将苹果芯片扩展到前所未有的新高度 。 凭借其强大的CPU、GPU、令人难以置信的神经引擎、ProRes硬件加速和海量的统一内存 , M1 Ultra让M1系列变得更加完善 , 成为世界上最强大、功能最强大的个人计算机芯片 。 ”
【出门问问|苹果发布M1 Ultra芯片:1140亿晶体管、20核CPU+64核GPU】据苹果官方介绍 , M1 Ultra的CPU与酷睿i5-12600K(搭配DDR5内存)在相同性能的情况下 , 功耗低65% , 或在酷睿i9-12900K三分之一功耗下 , 性能高出90% 。 M1 Ultra的GPU与GeForce RTX 3090相当 , 不过功耗要低得多 。